El error de Johansson de OpenAI pone la clonación de voz en el centro de atención
OpenAI se vio obligada a disculparse con la actriz Scarlett Johansson la semana pasada por usar su voz (o algo muy similar) en su último chatbot, centrando la atención en la tecnología de clonación de voz.
Aunque OpenAI negó que la voz que utilizaron fuera la de Johansson, su caso no fue ayudado por el hecho de que el CEO Sam Altman señalara el nuevo modelo con un mensaje de una sola palabra en las redes sociales: «Ella».
Johansson prestó su voz a un personaje de IA en la película «Her», que Altman ha dicho anteriormente que es su película favorita sobre la tecnología.
Desde el principio, la clonación de voz mediante IA ha resultado problemática.
El año pasado, la empresa británica Elevenlabs se volvió viral por motivos equivocados cuando lanzó su software de clonación de voz.
Los bromistas de Internet inmediatamente comenzaron a expulsar a celebridades falsificadas: se mostró a la estrella de Harry Potter, Emma Watson, leyendo «Mein Kampf» de Hitler.
Las autoridades advirtieron que los clones de IA podrían usarse para extorsionar a sus seres queridos por teléfono.
La tecnología se ha desarrollado rápidamente durante el último año y se ha vuelto mucho más realista y matizada.
El empresario danés Victor Riparbelli, director general de la empresa británica de inteligencia artificial Synthesia, dijo a la AFP que todo se debe en gran medida a un programa llamado Tortoise, lanzado hace dos años.
Los desarrolladores del programa introdujeron miles de horas de datos de voz en su modelo de forma no estructurada y descubrieron que no sólo aprendía qué decir sino cómo decirlo.
«Ese fue un cambio de paradigma bastante grande», dijo Riparbelli al margen de la conferencia VivaTech de la semana pasada en París.
Tortoise era un programa de código abierto y Elevenlabs fue el primero en salir al mercado usándolo.
OpenAI utiliza sistemas similares, aunque no revelan ningún detalle.
Gran parte de la controversia en torno a la clonación de voz se ha centrado en las preocupaciones sobre el uso indebido del software por parte de las personas.
Pero el reclamo contra OpenAI es inusual porque se acusa a la propia compañía de jugar rápido y libremente.
«Fue muy desafortunado que OpenAI hiciera eso, realmente no muy bien», dijo a la AFP Katya Laine, directora ejecutiva de TALKR.ai, en VivaTech.
«Si realmente clonaron su voz sin que ella lo supiera, entonces creo que es muy, muy malo», dijo Riparbelli.
Los dos empresarios se encuentran entre los cientos que aprovechan los programas de voz de IA para usos que, según afirman, harán que las empresas sean más eficientes.
La firma de Laine ofrece asistentes de voz virtuales, esencialmente agentes de servicio al cliente con inteligencia artificial.
Dijo que el sistema de su empresa ahora podría resolver entre el 25 y el 30 por ciento de las llamadas sin ninguna participación humana.
Synthesia se especializa en avatares de video, que según Riparbelli permitían a cualquier empleado de oficina convertir texto o diapositivas en un video realizado por una IA realista.
Tanto Riparbelli como Laine permiten a sus clientes utilizar sus propios avatares, productos disponibles en el mercado o aquellos suministrados por empresas como OpenAI y Elevenlabs.
Riparbelli dijo que Synthesia utilizó actores cuyas imágenes y voces tenían licencia por dos años con la opción de renovar después del período inicial.
Los problemas surgen si se utilizan las voces de los actores sin su consentimiento.
El fiasco eclipsó una conferencia de desarrolladores celebrada en París la semana pasada cuando OpenAI estaba mostrando un conjunto de nuevas herramientas.
Frente a una pantalla grande en un auditorio, Romain Huet, jefe de experiencia de desarrollador de OpenAI, conversaba alegremente por su teléfono.
Segundos después, su breve muestra de voz había sido procesada y se podía escuchar comentando en un video generado, en cinco idiomas.
La manifestación mostró lo rápido que avanza el sector, pero los titulares ya estaban escritos.
El Washington Post preguntó en un boletín «¿Qué tan tonto es OpenAI?», otros comentaristas sugerían que el niño prodigio Altman no era más que un vendedor ambulante.
No obstante, Riparbelli estaba abierto al argumento de OpenAI de que habían utilizado a otro actor que simplemente sonaba como Johansson.
«Si no es ella sino alguien que se parece mucho a ella… ¿dónde se traza esa línea?», preguntó Riparbelli. «Si no se les permite utilizar a alguien que se parezca mucho a ella, se sienta un precedente muy extraño».
© 2024 AFP