IA en la música: cómo la música generada por IA está revolucionando la industria y por qué los artistas desconfían

En abril del año pasado, Ghostwriter977, un Tik Tok usuario, escribió y produjo una canción llamada “Corazón en mi manga”. Sonaba igual que el rapero canadiense Drake y el cantautor The Weeknd. La canción se volvió viral y acumuló 15 millones de visitas en TikTok y cientos de miles de visitas cada uno en Spotify y YouTube. Pero ni Drake ni The Weeknd tenían idea de la canción.
No habían cantado ni una sola línea. Sus voces fueron generadas por inteligencia artificial (AI). La máquina ha pasado de sintetizar sonidos a generar voces cantadas. La IA está de moda en todas partes.

Anshuman Sharma y Aditya Kalway, dos jóvenes productores que ayudan al dúo de compositores musicales SalimSulaiman, recrearon “Haule haule ho jayega”, la exitosa canción de Rab Ne Bana Di Jodi de Shah Rukh Khan, con la voz de Mohammed Rafi. «Nos encontramos con algunos modelos vocales de IA que podrían producir las voces de los indios. cantantes como Kishore Kumar, Rafi y Sonu Nigam”, recuerda Sharma. En septiembre de 2023, Kalway cantó “Haule haule” con el estilo característico de Rafi, la sometió a un filtro vocal y la arregló musicalmente como una canción romántica de LaxmikantPyarelal de los años 70. Su Instagram Reel obtuvo 2,6 millones de visitas y aplausos de la industria de la músicaincluidos Vishal Dadlani, Shaan y Sonu Nigam.

En enero de este año, el compositor AR Rahman entró en el ring de la IA. Usó IA para generar las voces de Shahul Hameed y Bamba Bakya (dos cantantes con los que había colaborado pero que murieron prematuramente a los 40 años) para la canción “Thimiri yezhuda” en la película de Rajinikanth, Lal Salaam.

La IA es el nuevo sonido de la música. Un presagio de cambio y confusión, está sacudiendo la industria. Si bien el potencial de la tecnología es inmenso, los artistas temen que sus voces sean clonadas con solo hacer clic en unas pocas herramientas. “2023 es cuando la fase de exageración de la IA en la música realmente despegó”, dice Valerio Velardo, consultor en música e IA. con sede en Andalucía, España. Fundó Melodrive, un sistema de inteligencia artificial que compone música en tiempo real, en 2016, seguido de Sound of AI, uno de los ecosistemas de música de inteligencia artificial en línea más grandes. «Pasamos de una generación simbólica a una generación basada en audio», añade, refiriéndose al cambio del uso de símbolos para crear música (lo que hace un sintetizador o sampler) al uso de archivos de audio para entrenar modelos de IA para generar música. música. «Esto fue un salto», dice. Se ha recorrido un largo camino desde 1957, cuando el compositor y químico estadounidense Lejaren Hiller y el matemático Leonard Isaacson programaron la computadora Illiac de la Universidad de Illinois en Urbana-Champaign para componer un cuarteto de cuerda. La Suite Illiac es ampliamente considerada como la primera partitura compuesta por una computadora.

El uso de la inteligencia artificial en la música se disparó con la entrada de gigantes tecnológicos y poderosas empresas que priorizan la IA. Uno de los pioneros fue el Jukebox de OpenAI. Lanzado en 2020, generaba audio sin procesar que se aproximaba a las entradas que proporcionabas como un determinado músico o un género en particular.

A Google se le ocurrió MusicLM, que genera música de alta fidelidad a partir de mensajes de texto, en mayo de 2023. Meta siguió con AudioCraft en agosto. Pronto, Stability AI, que creó el popular modelo de conversión de texto a imagen Stable Diffusion, arrasó en la industria de la música con su Stable Audio. Un mensaje de texto como “una balada romántica discreta en un ambiente escandinavo, con armonías en tres octavas al estilo de Charlie Puth” generaría exactamente eso, con una voz y un estilo asombrosamente similares a los del cantautor estadounidense. “Esto es el equivalente a Midjourney o Dall-E, pero para música”, afirma Velardo.

Además de los modelos de las Big Tech, existe una proliferación de herramientas de inteligencia artificial para música gratuitas y de fácil acceso, especialmente aplicaciones de clonación de voz. Sharma y Kalway estaban jugando con esas herramientas cuando decidieron darle vida al sonido de Rafi.

¿QUIÉN ES EL DUEÑO DE MI VOZ?
La fácil replicación de voces famosas con el uso de IA ha planteado una pregunta importante: ¿quién tiene el poder? derechos de autor a una voz? ¿Su particular timbre y textura? Esto está generando repercusiones en toda la industria musical, generando enredos legales y conversaciones sobre derechos de autor.

Cuando Universal Music Group, la compañía de música líder en el mundo, entró en una disputa de licencia con la compañía de videos cortos TikTok Inc a principios de este año, la música generada por IA fue una gran parte de la disputa. Universal dijo que TikTok estaba «inundado de grabaciones generadas por IA». Derribó “Corazón en mi manga” de Ghostwriter977. Antes de eso, Universal había demandado a la empresa de inteligencia artificial Anthropic por distribuir letras con derechos de autor con su modelo de inteligencia artificial Claude 2.

Los cantantes también están alzando la voz contra el uso de la IA. A principios de este mes, 200 artistas, incluidos Stevie Wonder, Robbie Williams, Billie Eilish y Katy Perry, escribieron una carta abierta pidiendo a los desarrolladores de inteligencia artificial, empresas de tecnología, plataformas y servicios de música digital que detuvieran el uso de IA en la música lo que, dijeron, “disminuye los derechos de los artistas humanos”.

Las repercusiones también han llegado a la India. En enero, SP Kalyan Charan, hijo del legendario cantante SP Balasubrahmanyam, demandó a los productores y al director musical de una película en telugu llamada Keedaa Cola por el uso “no autorizado” de la voz de su difunto padre con la ayuda de IA. Los realizadores lo han negado. El cantante y músico Shankar Mahadevan se muestra cauteloso. “El uso de la tecnología es siempre un delicado equilibrio entre posibilidades y restricciones. La IA en la música es un avance tecnológico asombroso”, dice Mahadevan, que forma parte de la banda de fusión Shakti, ganadora del Grammy. “Pero debería usarse para mejorar una composición básica y no para crear o replicar creaciones humanas. De lo contrario, podría ser como copiar la melodía de alguien. ¿Es eso ético? él pide.

El auge de la IA tiene muchas ramificaciones. Por un lado, podría afectar las posibilidades de un nuevo cantante. Hoy en día, los nuevos artistas, en busca de un descanso, hacen versiones borrador de una canción antes de que un artista establecido cante la versión final. Son estos scratchs los que llaman la atención de los directores musicales sobre los nuevos artistas. Con clonación vocaltodo lo que un sello discográfico necesita hacer es elegir de una lista de interpretaciones filtradas vocalmente de cantantes consagrados para decidir qué voz se adaptará a la canción. El método de prueba y error de las versiones scratch, que suele ser el primer paso hacia la fama para un nuevo músico, podría pasarse por alto por completo.

«Creo que la IA es una buena herramienta en manos de alguien que entiende el proceso creativo orgánico y el proceso creativo electrónico», dijo el maestro de tabla Zakir Hussain y fundador de Shakti en una entrevista reciente a ET, y agregó: «En manos de alguien quien está totalmente desinformado, no sé en qué se convertirá”.

La IA puede brindar enormes oportunidades al mundo de la música. Un informe reciente de EY dijo que, en términos de crecimiento de ingresos y beneficios de costos, la IA generativa tendría un impacto por valor de 45.000 millones de rupias en el negocio de medios y entretenimiento en la India durante los próximos años. «Podría significar un aumento del 30 al 40% de los ingresos de la industria musical», dice Ashish Pherwani, líder de medios y entretenimiento de EY India.

“Ahora podemos mantener vivos a los artistas de antaño en la mente de sus fans por más tiempo. El costo de recrear una base de fans desaparece porque el fan de Hemant Kumar o Rafi escuchará las canciones que crees. Es un sueño hecho realidad desde el punto de vista empresarial”, añade.

NULIDAD LEGAL
Sin embargo, existe una brecha enorme. Actualmente no existe ninguna ley que proteja a los artistas, sus voces, estilos vocales y composiciones de ser recreados por herramientas generadas por IA, dice Velardo. «Es un vacío legislativo», dice. Señala dos problemas: “Uno es sencillo: estoy recreando la voz de Taylor Swift. Eso es una violación de los derechos de autor. Hay otro que es más sutil, que es el entrenamiento de sistemas musicales generativos completos. Las empresas de IA entrenan sus modelos con material que no les pertenece y no tienen permiso de los titulares de los derechos de autor para realizar la capacitación”.

La ausencia de leyes es un problema al que se enfrenta el abogado de Charan, Kavitha Deenadayalan, en la demanda contra los fabricantes de Keedaa Cola. “Existe una estrecha diferencia entre utilizar música generada por IA con fines de entretenimiento o para rendir homenaje a un cantante fallecido, y utilizarla con fines comerciales.

Cuando se comercializa, alguien tiene que obtener la licencia y el consentimiento y también pagar al artista la remuneración que se acuerde mutuamente”, afirma. “A falta de una ley, existe una necesidad ética de pedir permiso a los artistas o a sus familias. Eso es lo que hizo Rahman para ‘Thimiri yezhuda’”, añade. Gautam KM, socio de Krishnamurthy & Co y experto en derecho de la IA, dice: “Cuando generas música con la voz de alguien a través de una plataforma, ¿dónde se entrenó la plataforma? ¿Se basó en este caso en las canciones del difunto cantante SPB? En caso afirmativo, ¿el propietario de la plataforma ha obtenido de su patrimonio o de sus herederos los derechos necesarios para gestionar la plataforma con la voz de SPB? Si das letras a una plataforma y le pides que cree una grabación sonora con la voz de SPB, muy bien podrías estar infringiendo los derechos de la personalidad o los derechos morales del cantante original”, añade.

Se están levantando barreras legales. El estado de Tennessee en EE. UU. ha promulgado una nueva ley llamada Ley de Garantía de Seguridad de la Imagen, la Voz y la Imagen (Elvis) de 2024, que busca imponer responsabilidad a las empresas de tecnología e inteligencia artificial por el uso no autorizado de la voz o la imagen de una persona. La ley entrará en vigor el 1 de julio.

Mientras tanto, los artistas están levantando sus propias barreras contra la IA. La cantante canadiense Grimes ha creado un software de inteligencia artificial llamado Elf.Tech, que permite a los usuarios clonar su voz, pero tendrán que compartir el 50% de las regalías con ella. “En el momento en que comercializas una canción con la voz de inteligencia artificial de Grimes, vas a dividir los ingresos”, dice Velardo. También se ha asociado con la empresa de distribución de música TuneCore, con sede en Nueva York, para distribuir las canciones. En una entrevista reciente en The Music Podcast, el cantante Arijit Singh habló sobre los derechos de autor de su voz. Mahadevan se hace eco de esa opinión. “Todo artista tiene derechos de autor sobre su voz. Ciertamente lo haría”, dice.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *