Sommaire
Eh bien, les amis de Stability AI ne chôment pas ! Après nous avoir régalés avec Stable Diffusion, leur célèbre générateur d’images basé sur l’IA, la startup spécialisée dans l’intelligence artificielle récidive en lançant Stable Audio Open. Bienvenue dans l’ère de la musique générée par l’IA ! (Ou du moins des sons, pour commencer.)
Stable Audio Open : un modèle pour générer des sons à gogo
Concrètement, ce nouveau modèle de langage se nourrit d’une simple description textuelle (du genre « Rock beat suonato in studio, sessione di batteria su un kit acustico » pour les polylithanglophiles parmi nous) et délivre une génération sonore d’une durée maximale de 47 secondes.
Stability AI affirme que le modèle a été entraîné uniquement sur des enregistrements exempts de droits d’auteur, soit environ 486 000 échantillons provenant des bibliothèques musicales gratuites FreeSound et Free Music Archive.
À quoi sert Stable Audio Open ?
Mais que peut-on bien faire avec un tel outil ? Selon Stability AI, les possibilités sont nombreuses : créer des rythmes de batterie, des riffs d’instruments, des bruits ambiants, ou encore des « éléments de production » pour vos vidéos, films ou émissions de télévision. Vous pouvez même « modifier » des morceaux existants ou appliquer le style d’un genre musical (disons, le jazz) à un autre échantillon. Pas mal, non ?
Mieux encore, le caractère open source de Stable Audio Open offre un avantage de taille, d’après l’entreprise : « Les utilisateurs peuvent peaufiner le modèle avec leurs propres données audio personnalisées. » Un batteur pourrait ainsi entraîner le modèle avec ses propres enregistrements pour générer de nouveaux rythmes inédits. (Ouf, plus besoin d’apprendre à jouer, on peut juste demander à l’IA !)
Les limites de Stable Audio Open
Mais avant de vous emballer, sachez que Stable Audio Open a aussi ses limites. Le modèle n’est pas (encore ?) capable de produire des chansons, des mélodies ou des voix complètes.
Stability AI reconnaît que le modèle n’est pas optimisé pour de telles tâches et suggère aux utilisateurs intéressés d’opter plutôt pour son service payant, Stable Audio.
Stable Audio Open ne convainc pas tout le monde
Au-delà de ses limites techniques, Stable Audio Open soulève également des interrogations. Tout d’abord, son utilisation à des fins commerciales est prohibée. Ensuite, ses performances semblent varier en fonction des styles musicaux et des langues utilisées dans les descriptions. Stability AI admet d’ailleurs que « la source des données est potentiellement dépourvue de diversité et que toutes les cultures ne sont pas également représentées dans l’ensemble de données. »
Enfin, l’entreprise est récemment devenue la cible de vives critiques après que son vice-président du « generative audio », Ed Newton-Rex, a démissionné en désaccord avec la position de Stability AI. Cette dernière estime que l’entraînement de modèles IA sur des œuvres protégées par le droit d’auteur relève du « fair use » (usage loyal). Une position controversée qui soulève des questions éthiques et juridiques dans l’utilisation de l’IA pour la création artistique.
Stable Audio Open, une tentative de redorer son blason ?
Certains observateurs y voient d’ailleurs une tentative de Stability AI de redorer son blason, tout en faisant la promotion de ses services payants. Quoi qu’il en soit, Stable Audio Open représente une nouvelle étape dans le développement de l’IA générative pour la création sonore. Un domaine passionnant, mais qui soulève encore de nombreuses questions sur les plans éthique, juridique et créatif. (Oui, on peut aussi avoir de l’humour tout en restant sérieux, faut pas déconner non plus !)
Résumé / TL;DR
- Stability AI lance Stable Audio Open, un modèle IA open source pour générer des sons
- Le modèle peut créer des rythmes de batterie, des riffs d’instruments, des bruits ambiants, etc.
- Mais il ne peut pas (encore) produire des chansons, des mélodies ou des voix complètes
- Stable Audio Open fait polémique en raison des questions éthiques et juridiques soulevées par l’entreprise