OpenAI dice que es «imposible» entrenar IA sin materiales con derechos de autor

OpenAI dice que es «imposible» entrenar IA sin materiales con derechos de autor

OpenAI enfrenta múltiples demandas por el uso de artículos, libros y arte protegidos por derechos de autor para entrenar sus herramientas de inteligencia artificial (IA) generativa.

ANUNCIO

OpenAI, la compañía detrás del chatbot de inteligencia artificial (IA) ChatGPT, ha dicho que sería «imposible» entrenar sus herramientas de IA sin utilizar materiales protegidos por derechos de autor.

Se produce cuando OpenAI enfrenta múltiples demandas relacionadas con el uso de derechos de autor. artículos, librosy arte para entrenar ChatGPT. Otras empresas de inteligencia artificial enfrentan demandas similares.

Las herramientas de IA generativa se entrenan con grandes cantidades de contenido de Internet que utilizan para analizar y aprender patrones para generar nuevo contenido similar al humano.

«Debido a que los derechos de autor cubren hoy prácticamente todo tipo de expresión humana -incluyendo publicaciones de blogs, fotografías, publicaciones en foros, fragmentos de código de software y documentos gubernamentales- sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor», argumentó OpenAI en un escrito. pruebas presentadas a la Cámara de los Lores del Reino Unido el mes pasado.

La respuesta de la empresa como parte de una investigación sobre los grandes modelos lingüísticos (LLM) fue publicada por primera vez en el periódico británico. El Telégrafo.

Abierto AI Afirmó que «limitar» los datos de entrenamiento a contenidos de dominio público «no proporcionaría sistemas de IA que satisfagan las necesidades de los ciudadanos de hoy».

Añadió que si bien la empresa cree que «la ley de derechos de autor no prohíbe la formación», reconoce que «todavía queda trabajo por hacer para apoyar y empoderar a los creadores».

ChatGPTque se lanzó en noviembre de 2022, ha acelerado el avance de las herramientas de inteligencia artificial debido a su aumento de popularidad durante el año pasado.

Pero también ha extendido la preocupación de que las herramientas de inteligencia artificial que producen contenido escrito y obras de arte resulten en la pérdida de empleos en múltiples industrias.

OpenAI responde a la demanda del New York Times

El New York Times fue la última empresa en presentar una demanda contra OpenAI por infracción de derechos de autor, argumentando que la empresa AI les debía «miles de millones de dólares en daños legales y reales».

La extensa demanda de 69 páginas afirma que OpenAI utilizó ilegalmente el trabajo del New York Times para crear sistemas de inteligencia artificial que competirían con las empresas de medios.

Las herramientas de OpenAI generan «resultados que recitan el contenido del Times palabra por palabra, lo resumen detalladamente e imitan su estilo expresivo, como lo demuestran decenas de ejemplos», argumenta la demanda.

Un ejemplo de la demanda muestra un texto de GPT-4 que se parecía mucho a una investigación del New York Times ganadora del premio Pulitzer en 2019 sobre la industria del taxi.

La demanda destaca que estas herramientas también han sido extremadamente lucrativas para OpenAI y Microsoft, que es su mayor inversor.

OpenAI respondió esta semana en un publicación de blog separada al abordar la demanda del periódico estadounidense, argumentando que entrenar modelos de IA con material disponible en Internet es un «uso justo» y que el caso del New York Times fue «sin mérito».

Dijo que ha trabajado para asociarse con organizaciones de noticias para «crear oportunidades mutuamente beneficiosas» y afirmó que los medios de noticias son una «pequeña porción» del contenido utilizado para entrenar los sistemas de IA.

La empresa de IA ha llegado a acuerdos con empresas de medios como la Associated Press y Axel Springerpropietaria de las empresas de medios Politico, Business Insider, Bild y Welt, para licenciar sus contenidos para formación.

OpenAI también argumentó en su publicación de blog que tiene una opción de exclusión simple para impedirle acceder a los sitios web de los editores.

ANUNCIO

Añadió que la memorización y repetición de los contenidos de la formación era un «fracaso» del sistema que debe aplicar conceptos a «nuevos problemas».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *