"Lo único que no podemos hacer es firmar autógrafos": así es el auge de las bandas virtuales de K-pop, generadas por IA
(CNN) -- En el video musical de su último single, "DTDTGMGN", las integrantes del grupo surcoreano Eternity bailan al ritmo de un bubblegum pop en una habitación rosa neón decorada con uniformes escolares y carteles de famosos. Los vertiginosos movimientos de cámara y los rápidos cambios de escena son típicos del género K-pop, que se ha convertido en un fenómeno mundial en los últimos años.
"Abrázame fuerte, apóyate en mi hombro", canta uno de ellas.
Pero los seguidores del grupo no pueden hacer nada de eso, físicamente hablando, porque ninguna de las 11 integrantes de Eternity es real.
Eternity, creado con tecnología de inteligencia artificial, es uno de los últimos grupos surcoreanos que han ampliado la frontera entre el entretenimiento real y el virtual. Pulse9, la empresa creadora y gestora del grupo, cree que las estrellas generadas por ordenador tienen una ventaja significativa sobre sus homólogas reales.
Como la mayoría de los grupos populares de K-pop, Eternity está formado por una líder, vocalistas, raperos y bailarines. Pero un miembro en particular, Zae-in, puede hacerlo todo. "Zae-in tiene una combinación de características que a la mayoría de los artistas humanos les costaría mucho conseguir. Sabe cantar muy bien, rapear muy bien y puede ser creativa como diseñadora (de moda). Y es una actriz nata", afirma Park Ji-eun, directora ejecutiva de la empresa.
Con la ayuda de una tecnología de intercambio de rostros en tiempo real y una voz generada por inteligencia artificial, Zae-in es interpretada por 10 personas diferentes, entre actores, cantantes y bailarines, que prestan su talento a su avatar cuando es necesario. En un video publicado en la cuenta de Instagram de Zae-in, por ejemplo, monta hábilmente en una tabla de longboard junto al río Han de Seúl. Para el video, sus creadores filmaron la acrobacia con un doble cuya cara se cambió después por la de Zae-in.
"Está la Zae-in de la música pop, la Zae-in actriz, la Zae-in reportera. Existen varias, así que nuestra ventaja única es que podemos hacer lo que una persona no puede", dijo la estrella virtual a CNN en una entrevista vía Zoom durante la cual fue interpretada por una actriz (aunque Pulse9 dijo que su software de IA puede recrear la voz de Zae-in y generar el habla sin intervención humana).
"Lo único que no podemos hacer es firmar un autógrafo", añade con una sonrisa en los ojos.
El intercambio de rostros en tiempo real y las primeras formas de tecnología "deepfake" existen desde hace casi una década. En ese tiempo, influencers virtuales como Lil Miquela y la surcoreana Rozy han conseguido grandes cantidades seguidores en Internet en los ámbitos de la moda y la música.
Pero los últimos avances en video y audio generados por IA están facilitando a empresas como Pulse9 la creación de personajes virtuales convincentes, mientras que los avances en programas de IA generativa como ChatGPT están eliminando la necesidad de que estrellas como Zae-in sean "interpretadas" por nadie.
¿Cómo fueron hechas?
El equipo de Pulse9 comenzó el proceso de dar "vida" a la eternidad diseñando el aspecto de sus miembros. El equipo de Park generó 101 rostros digitales únicos, inspirados en celebridades coreanas existentes, antes de dividirlos en cuatro categorías —denominadas "sexy", "lindo", "inteligente" e "inocente"— y reducir la selección a 11 mediante una encuesta en línea.
Con tecnología de captura de movimientos y deepfake, Pulse9 produjo el primer video musical del grupo (que acompaña al tema "I'm Real", de título irónico) en 2021. La reacción al video fue variada. Muchos usuarios de las redes sociales opinaron que las expresiones faciales de los miembros del grupo parecían antinaturales y ajenas a sus cuerpos, mientras que otros citaron el efecto "valle inquietante", por el que los espectadores se sienten incómodos ante cosas que se parecen a los humanos pero no lo son.
Pero cinco meses después, cuando Pulse9 publicó el siguiente video musical de Eternity, "No Filter", los seguidores observaron que el grupo casi no se distinguía del real. "Me sorprende lo realistas que suenan, y los visuales parecen más realistas que la canción de debut", dice el comentario con más likes en YouTube.
"DTDTGMGN", que salió el pasado octubre, supuso otro gran salto de calidad. "Hasta el año pasado, la cara era la única parte virtual del artista, pero ahora podemos crear imágenes de cuerpo entero con tecnología de IA", explica Park, que añade que "No Filter" también se compuso con IA (aunque luego los humanos editaron la canción y escribieron la letra).
SM Entertainment, la agencia detrás de megaestrellas del K-pop como Super Junior, Girls' Generation y Exo, entre otras, también ha estado experimentando con la IA. En 2020, la empresa presentó Aespa, un grupo formado por cuatro artistas humanos y sus homólogos virtuales. Tras el lanzamiento del grupo, el fundador de SM, Lee Soo-man, declaró que el futuro del entretenimiento son "las celebridades y los robots".
Por otra parte, Hybe, la empresa de gestión de BTS, utilizó la IA para ajustar la pronunciación y el tono de uno de sus cantantes, antes de publicar una de sus canciones en seis idiomas: coreano, inglés, español, chino, japonés y vietnamita.
Y a principios de este año, Metaverse Entertainment, una agencia formada por el editor de videojuegos Netmarble y la empresa matriz de SM Entertainment, Kakao Entertainment, presentó un grupo virtual de chicas, MAVE. A diferencia de Eternity, que se basa en simples intercambios de caras, las cuatro integrantes de MAVE se generaron desde cero mediante CGI.
Metaverse Entertainment utilizó tecnología de IA para generar rostros, fusionando los rasgos y peinados considerados más deseables en cuatro personajes finales. La empresa empleó tecnología de captura de movimiento para grabar actuaciones reales de K-pop que luego un programa de aprendizaje profundo utilizó para animar los vídeos musicales. Según Kang Sung-ku, director técnico de Metaverse Entertainment, las voces del grupo son en parte humanas y en parte generadas por IA.
"Nuestro objetivo es crear seres humanos virtuales totalmente controlados por la IA que sean realmente creíbles", declaró a CNN.
El video musical del primer single de MAVE, "Pandora", ya ha acumulado 25 millones de visitas en YouTube desde su lanzamiento en enero.
¿Y el futuro del K-pop?
Las estrellas virtuales pueden tener ventaja sobre las humanas a la hora de relacionarse con sus seguidores. Según Kang, los avances en los programas lingüísticos de inteligencia artificial podrían hacer posible que los fans "hablaran" con sus ídolos e incluso entablaran una relación personal con ellos.
"Recordarán lo que hablamos ayer y podrán seguir hablando de cosas (de conversaciones anteriores). Te recordarán y sabrán de ti, y hablarán (contigo) basándose en esa información", dijo, haciendo una comparación entre las creaciones de IA de su empresa y el asistente virtual del iPhone, Siri.
Metaverse Entertainment ya está experimentando con esta idea a través de aplicaciones que permiten a los usuarios interactuar directamente con MAVE. En la actualidad, los miembros del grupo hablan coreano, inglés, francés e indonesio, lo que da idea de sus principales bases de fans y mercados objetivo, aunque en teoría podrían hablar cualquier número de idiomas.
"Hay cosas que no puedo contarles (ni siquiera a mis mejores amigos), pero quizá pueda contárselas a una IA personalizada, que pueda consolarme y preocuparse por mí. Creo que será bueno para todos", afirma Kang.
El desarrollo podría ser ciertamente bueno para empresas como la de Kang. La industria del K-pop se sustenta en un laborioso sistema de aprendices, en el que los aspirantes son moldeados desde una edad temprana, a menudo pasando por años de costosas clases de baile y música antes de debutar. (Según The Wall Street Journal, SM Entertainment gastó unos US$ 3 millones en sacar al mercado a Girls Generation en 2007). Las agencias deben invertir en clases, espacio de estudio, estilismo y, a veces, incluso procedimientos estéticos para los miembros potenciales de la banda, costes que no son necesarios para los talentos virtuales.
Además, las estrellas del pop generadas por ordenador nunca enfermarán, envejecerán ni se verán envueltas en disputas contractuales o escándalos sensacionalistas. Pero no hay muchas posibilidades de que las grandes agencias sustituyan a corto plazo a sus bandas reales, afirma Kang, aunque reconoce que algunos sectores del público del K-pop han reaccionado mal ante los grupos creados por IA.
"Las críticas se referían a la sustitución de los ídolos actuales por otros virtuales: pensaban que los ídolos actuales podrían perder su trabajo", dijo Kang, añadiendo que algunos fans siempre preferirán a los artistas humanos.
Park, creador de Eternity, se mostró de acuerdo y comparó la aparición de la IA con la invención de la fotografía en el siglo XIX: "Muchos pintores temían (la nueva) tecnología, pero hoy seguimos teniendo pintores. Creo que BTS nunca temerá a los ídolos virtuales: sólo son nuevos contenidos".