Dans un studio d'enregistrement faiblement éclairé de Séoul, les producteurs du label de musique K-pop qui a fait connaître au monde entier le groupe de garçons BTS utilisent l'intelligence artificielle pour fusionner la voix d'un chanteur sud-coréen avec celles de locuteurs natifs de cinq autres langues.

Cette technologie a permis à HYBE, le plus grand label musical de Corée du Sud, de publier en mai un titre de la chanteuse MIDNATT en six langues : coréen, anglais, espagnol, chinois, japonais et vietnamien.

Certains chanteurs de K-pop ont sorti des chansons en anglais et en japonais en plus de leur langue maternelle, le coréen, mais l'application de la nouvelle technologie pour une sortie simultanée en six langues est une première mondiale, selon HYBE, et pourrait ouvrir la voie à l'utilisation de cette technologie par des groupes plus populaires.

"Nous écouterons d'abord les réactions, la voix des fans, puis nous déciderons des prochaines étapes", a déclaré Chung Wooyong, directeur de la branche médias interactifs de HYBE, lors d'une interview dans le studio de l'entreprise.

Lee Hyun, 40 ans, connu sous le nom de MIDNATT, qui ne parle que très peu l'anglais et le chinois en plus du coréen, a enregistré la chanson "Masquerade" dans chaque langue.

Des locuteurs natifs ont lu les paroles, puis les deux ont été combinées de manière transparente avec l'aide de la technologie musicale IA interne de HYBE, a déclaré M. Chung.

Cette chanson est le dernier signe en date de l'influence croissante de l'IA dans l'industrie musicale, à l'heure où les Grammy Awards ont introduit de nouvelles règles pour l'utilisation de cette technologie et où les mash-ups de chansons générés par l'IA inondent les médias sociaux.

"Nous avons divisé un morceau de son en différents éléments : prononciation, timbre, hauteur et volume", explique M. Chung. "Nous avons examiné la prononciation, qui est associée au mouvement de la langue, et nous avons fait preuve d'imagination pour voir quel type de résultat nous pourrions obtenir grâce à notre technologie.

Dans une comparaison avant-après montrée à Reuters, une voyelle allongée a été ajoutée au mot "twisted" dans les paroles anglaises, par exemple, pour paraître plus naturelle, alors qu'aucun changement détectable n'a été apporté à la voix du chanteur.

Selon Choi Hee-doo, directeur général de Supertone, l'utilisation de l'apprentissage en profondeur grâce au cadre d'analyse et de synthèse neuronales (NANSY) mis au point par Supertone rend la chanson plus naturelle que l'utilisation d'un logiciel non automatisé.

HYBE a annoncé l'acquisition de Supertone pour un montant de 45 milliards de wons (36 millions de dollars) en janvier. HYBE a déclaré qu'elle prévoyait de rendre accessible aux créateurs et au public une partie de la technologie d'IA utilisée dans la chanson de MIDNATT, mais n'a pas précisé si elle demanderait des frais.

UNE "EXPÉRIENCE IMMERSIVE

MIDNATT a déclaré que l'utilisation de l'IA lui avait permis d'élargir son "spectre d'expressions artistiques".

"J'ai l'impression que la barrière de la langue a été levée et qu'il est beaucoup plus facile pour les fans du monde entier de vivre une expérience immersive avec ma musique", a-t-il déclaré dans un communiqué.

Bien que la technologie ne soit pas nouvelle, il s'agit d'une manière innovante d'utiliser l'IA dans la musique, a déclaré Valerio Velardo, directeur de The Sound of AI, un service de conseil basé en Espagne pour la musique et l'audio de l'IA.

À long terme, les musiciens professionnels, mais aussi une population plus large, bénéficieront de la technologie de l'IA dans le domaine de la musique, a déclaré M. Velardo.

"Elle va abaisser la barrière de la création musicale. C'est un peu comme Instagram pour les photos, mais dans le cas de la musique."

Pour l'instant, la technologie de correction de la prononciation de HYBE prend "des semaines ou des mois" pour faire son travail, mais lorsque le processus s'accélérera, elle pourrait servir un plus large éventail d'objectifs tels que l'interprétation dans les vidéoconférences, a déclaré Choi Jin-woo, le producteur de "Masquerade" de MIDNATT, qui se fait appeler Hitchhiker. (Reportage de Hyunsu Yim ; Reportage complémentaire de Daewoung Kim et Hyun Young Yi ; Montage de Josh Smith et Jamie Freed)