Les applications et les possibilités offertes par toutes sortes de modèles linguistiques pour la création de contenu sont en réalité assez étendues. Il suffit de dire que même le ChatGPT commun s’avère être un outil extrêmement utile pour les personnes qui ont besoin d’aide avec ce qu’on appelle bloc créatif.
SunoAI, un outil permettant de créer vos propres chansons basées sur des paroles et des invites appropriées, est également très populaire parmi les fans de musique. La créativité créée dans cet outil semble parfois n’avoir aucune limite, ce qui est en fait très agréable, surtout pour ceux qui n’ont pas peur de telles expériences.
Un nouvel outil a été créé pour ces personnes, cette fois développé par NVIDIA. Qu’est-ce que Fugatto ? Quelles possibilités a-t-il ?
Fugatto, un outil de création de sons
Fugatto (de l’anglais Transformateur Audio Génératif Fondamental Opus 1) est un modèle GenAI avancé développé par les ingénieurs NVIDIA qui vous permet de manipuler le son à l’aide de commandes textuelles. Il peut créer de la musique, remplacer des voix, ajouter des effets et créer des sons complètement uniques. Fugatto gère plusieurs tâches simultanément et combine diverses instructions telles que l’accent ou l’émotion dans la voix.
L’échelle avec laquelle ce modèle a été créé est également impressionnante. Nous parlons de 2,5 milliards de paramètres utilisés par Fugatto pour ses besoins. Bien entendu, tout cela est alimenté par les technologies NVIDIA, et le tout a été créé et développé par une équipe de différents pays. Grâce à ses fonctions innovantes, Fugatto permet aux utilisateurs de mener des expériences artistiques à une échelle sans précédent.
Il n’est donc pas surprenant que les ingénieurs aient qualifié leur modèle de « couteau suisse » en matière de son. Les possibilités sont énormes, car cette technologie a été entraînée sur beaucoup de données. Il était disponible, entre autres : BBC Sound Library, qui vous donne accès à une richesse de sources vraiment impressionnantes.
D’énormes possibilités
Mais à quoi peut bien servir Fugatto ? Eh bien, vous pouvez citer l’exemple des producteurs de musique qui pourront créer un « croquis » d’une chanson en fonction des invites. Ils pourront également facilement ajouter des effets ou essayer d’ajuster différents styles, instruments ou effets avec seulement quelques commandes.
Le héros de notre aujourd’hui pourra également améliorer la qualité globale des pistes existantes ou permettre l’isolation d’instruments individuels. Il existe de nombreuses possibilités et elles ne se limitent pas à l’industrie musicale.
Comme cela a été établi, Fugatto opère également sur les sons, ce qui peut permettre aux développeurs de jeux d’adapter les sons à des situations dynamiques. Cela peut se traduire par une plus grande individualité pour chaque joueur, qui entendra des sons différents ou des dialogues différemment amplifiés selon la situation.
La situation est similaire dans le cas du marketing, où ce modèle est capable d’adapter le son et l’accent du narrateur à une région spécifique. Il s’agit d’une grande simplification pour tous ceux qui ont l’intention de créer des campagnes publicitaires à l’avenir et de toucher des destinataires du monde entier.
Quand Fugatto sera-t-il disponible pour un usage général ?
Selon les ingénieurs de Fugatto, nous entrons dans une nouvelle ère de création musicale et sonore, où l’IA sera notre meilleure assistante. Il est intéressant de noter que cet enthousiasme est partagé par le célèbre producteur Ido Zmishlany.
En fait, dans ce cas, le seul obstacle semble être notre propre créativité. Je me demande comment le modèle NVIDIA va faire face à la multitude d’utilisateurs intéressés.
Pour l’instant, cependant, NVIDIA n’a pas révélé quand nous pouvons nous attendre à ce que Fugatto soit publié et mis à la disposition d’un public plus large. Pour l’instant, nous ne pouvons qu’attendre et espérer que cela se produira le plus tôt possible.