La collaboration homme-machine s’impose de plus en plus comme la norme dans l’industrie musicale. La preuve avec SingSong. Cette intelligence artificielle est capable de générer des pistes de fond (des “backing tracks”) pour accompagner les voix enregistrées par des chanteurs. Une avancée qui impressionne autant qu’elle interroge.
SingSong a été créé par des chercheurs de l’institut Google Research. Elle est décrite comme “un nouveau moyen intuitif de créer de la musique” pour les chanteurs plus ou moins aguerris. Jesse Engel et ses confrères ont utilisé un algorithme pour séparer les pistes instrumentales et vocales de 46.000 heures de musique. Ils ont ensuite utilisé un modèle d’intelligence artificielle précédemment développé par Google Research pour harmoniser ces différents enregistrements. Cette phase d’expérimentation a permis à l’intelligence artificielle d’apprendre à travailler avec des pistes audio qui ne figuraient pas initialement dans sa base de données et à créer des accompagnements musicaux sur mesure, selon la revue New Scientist.
Mais sont-ils au niveau de ceux imaginés par un humain ? Pour répondre à cette question, les scientifiques ont fait écouter 800 courts enregistrements enrichis par l’intelligence artificielle à des amateurs de musique. Ils voulaient savoir s’ils étaient capables de différencier les morceaux dont les pistes de fond avaient été générées par la machine, de ceux où elles avaient été composées par un musicien en chair et en os, ou ajoutées de façon aléatoire.
Les participants de l’étude, dont les conclusions ont été publiées en ligne, ont préféré la contribution de l’intelligence artificielle dans 66% des cas. Ils trouvaient que les accompagnements musicaux qu’elle avait générés étaient plus compatibles avec la voix du chanteur ou de la chanteuse principale. “D’un point de vue subjectif, SingSong produit des pistes instrumentales qui ont une correspondance harmonique et temporelle claire avec les voix d’entrée”, affirment les chercheurs.
Un concurrent direct aux musiciens ?
Ils ont toutefois remarqué que SingSong avait plus de mal à créer des pistes de fond convaincantes lorsque les voix étaient enregistrées par des chanteurs amateurs. La raison ? Ces derniers peinent souvent à rester dans le bon tempo et à conserver la même hauteur de voix. Mais Jess Aslan, conférencière à l’université de Londres, trouve ces premiers résultats très convaincants. “Je ne dirais pas que vous pourriez sortir le morceau en tant que tel. Il faudrait le peaufiner, mais il est certain qu’il semble fonctionner en termes de cohérence”, a-t-elle déclaré à The New Scientist.
La création de SingSong soulève de nombreuses questions quant au rôle que jouera, à l’avenir, l’intelligence artificielle dans l’industrie musicale. Certains craignent qu’elle devienne un concurrent direct aux auteurs-compositeurs, aux producteurs, voire même aux chanteurs. En effet, Microsoft a récemment développé un outil du nom de Vall-E capable de reproduire n’importe quelle voix à partir d’un simple échantillon de trois secondes. Cette innovation pourrait potentiellement être utilisée dans la création de nouveaux morceaux, même si elle n’a pas été créée dans ce but précis.
Quoiqu’il en soit, de nombreuses voix s’élèvent pour la mise en place d’une réglementation ferme face au succès rencontré par les intelligences artificielles dites génératives. La Chine a pris les devants sur cette question en annonçant l’entrée en vigueur, le 10 janvier, d’un texte de loi imposant que tout contenu généré par l’IA soit clairement identifié comme tel, selon Techcrunch. Il y a fort à parier que d’autres gouvernements suivent son exemple dans les prochains mois.