Comerciante: el plan de la industria de la IA para resolver su problema de derechos de autor

Comerciante: el plan de la industria de la IA para resolver su problema de derechos de autor

Esta vez en 2023, el mundo estaba cautivado al surgimiento del deslumbrante chatbot de OpenAI. ChatGPT estaba haciendo metástasis como una infección por hongos, acumulándose decenas de millones de usuarios al mes. Se materializaron asociaciones multimillonarias y las inversiones llegaron a raudales. Las grandes empresas tecnológicas se unieron a la fiesta. Los generadores de imágenes de IA como Midjourney tomaron vuelo.

Apenas un año después, el ánimo se ha ensombrecido. La sorpresa despido y reintegro rápido del director ejecutivo de OpenAI, Sam Altman, le dio a la empresa Un momento vergonzoso en el que el emperador está desnudo. Beneficios son escasos en todo el sectory los costos de computación están por las nubes. Pero hay una cuestión que cobra importancia por encima de todas y amenaza con hacer que la incipiente industria vuelva a la tierra: los derechos de autor.

Las denuncias judiciales que surgió a lo largo del año pasado se han convertido en un coro atronador, y las empresas de tecnología dicen que ahora presentan una amenaza existencial para la IA generativa (del tipo que puede producir escritura, imágenes, música, etc.). Si 2023 fue el año en el que el mundo se maravilló de los generadores de contenido de IA, 2024 puede ser el año en que los humanos que crearon las materias primas que hicieron posible ese contenido se venguen, y tal vez incluso recuperen parte del valor generado por su trabajo.

En los últimos días de diciembre, el El New York Times presentó una demanda explosiva contra Microsoft y OpenAI, alegando que “millones de sus artículos se utilizaron para entrenar chatbots automatizados que ahora compiten con los medios de comunicación como fuente de información confiable”. La demanda del Times se suma a muchas otras: demandas colectivas presentadas por ilustradorespor el servicio de fotografía Getty Imágenespor George RR Martin y el gremio de autorespor usuarios anónimos de redes socialespor nombrar algunos, todos alegando que las empresas que pueden beneficiarse de la IA generativa utilizaron el trabajo de escritores, reporteros, artistas y otros sin consentimiento ni compensación, infringiendo sus derechos de autor en el proceso.

Nuestros experimentos hacen que sea casi seguro que estos sistemas en realidad están entrenando con material protegido por derechos de autor.

— El científico cognitivo Gary Marcus

Cada uno de estos pleitos tiene sus méritos, pero la entrada de la Dama Gris a la arena cambia el juego. Por un lado, el Times influye en la configuración de las narrativas nacionales. Por otro, la demanda del Times es singularmente condenatorio; Está repleto de ejemplo tras ejemplo de cómo ChatGPT replica artículos de noticias casi palabra por palabra y ofrece las respuestas a sus clientes de pago, sin atribución.

No se trata sólo de las demandas: el Congreso, los investigadores y los expertos en inteligencia artificial también están aumentando la presión. El miércoles, una audiencia en el congreso Se vio a senadores y representantes de la industria de los medios de comunicación acordar que las empresas de inteligencia artificial deberían pagar tarifas de licencia por el material que utilizan para entrenar sus modelos. «No sólo es moralmente correcto», dijo el senador Richard Blumenthal (demócrata por Connecticut), quien preside el subcomité que celebró la audiencia, según cableado. «Es un requisito legal».

Mientras tanto, un incendio estudio publicado recientemente en IEEE SpectrumCoescrito por el científico cognitivo y experto en IA Gary Marcus y el veterano de la industria cinematográfica Reid Southern, muestra que Midjourney y Dall-E, dos de los principales generadores de imágenes de IA, fueron entrenados en material protegido por derechos de autor y pueden regurgitar ese material a voluntad. a menudo sin siquiera que se lo pidieran.

«Nuestros experimentos hacen que sea casi seguro que estos sistemas en realidad están entrenando con material protegido por derechos de autor», me dijo Marcus, algo que las empresas se han mostrado tímidas a la hora de aceptar explícitamente. «Las empresas no han sido nada sencillas en cuanto a lo que utilizan, por lo que era importante establecer que son utilizando materiales protegidos por derechos de autor”. También es importante: que las obras que infringen los derechos de autor salgan de los sistemas con poca insistencia. “No es necesario que le indiques que diga ‘crear C3P0’; simplemente puedes decir ‘dibujar un droide dorado’. O ‘fontanero italiano’: simplemente atraerá a Mario”.

Esto tiene serias implicaciones para cualquiera que utilice los sistemas con fines comerciales. «Las empresas cuyas propiedades son infringidas (Mattel, Nintendo) se interesarán en esto», dice Marcus. “Pero el usuario también queda vulnerable: no hay nada en el resultado que diga cuáles son las fuentes. De hecho, el software no es capaz de hacerlo de manera confiable. Así que los usuarios están en apuros y no tienen idea de si se trata de una infracción o no”.

También hay una sensación de impulso que está empezando a generarse detrás de la simple noción de que los creadores deberían ser compensado por el trabajo que utilizan empresas de inteligencia artificial valoradas en miles de millones o decenas de miles de millones, o cientos de miles de millones de dólares, como lo son Google y Microsoft. La noción de que los sistemas generativos de IA están en la raíz “máquinas de plagio” se ha vuelto cada vez más común entre sus críticos y las redes sociales están llenas de oprobio contra la IA.

Pero no es probable que esas empresas de IA cedan. El año pasado vimos un presagio de cómo las empresas de IA responderían a las preocupaciones generales sobre derechos de autor, cuando el famoso capitalista de riesgo y evangelista de la IA La firma de Marc Andreessen argumentó que las empresas de IA quebrarían si tuvieran que pagar derechos de autor o derechos de licencia. Esta misma semana, los medios de comunicación británicos informaron que OpenAI ha hizo el mismo casobuscando una exención de las normas de derechos de autor en Inglaterra, alegando que la empresa simplemente no podía operar sin ingerir materiales protegidos por derechos de autor.

«Debido a que los derechos de autor cubren hoy prácticamente todo tipo de expresión humana, incluidas publicaciones de blogs, fotografías, publicaciones en foros, fragmentos de código de software y documentos gubernamentales, sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor», argumentó OpenAI en su presentación. a la Cámara de los Lores. Tenga en cuenta que tanto las declaraciones de Andreessen como OpenAI subrayan el valor del trabajo protegido por derechos de autor al argumentar que las empresas de IA no deberían tener que pagar por él.

¿Qué pueden hacer al respecto?

Primero, alegan pobreza. Simplemente hay demasiado material disponible para compensar a todos los que contribuyeron a que su sistema funcionara y a que su valoración se disparara. “Una pequeña y pobre empresa rica valorada en 100.000 millones de dólares no puede permitírselo”, afirma Marcus. «No sé qué tan bien funcionará, pero eso es lo que están discutiendo».

Las empresas de IA también argumentan que lo que están haciendo cae dentro de la doctrina legal del uso legítimo (probablemente el argumento más fuerte que tienen) porque es transformador. Este argumento ayudó a Google a ganar en los tribunales contra los grandes editores de libros cuando copiaba libros en su enorme base de datos Google Books, y a derrotar las afirmaciones de que YouTube se estaba beneficiando al permitir a los usuarios alojar y difundir material sin licencia.

A continuación, las empresas de IA argumentan que los resultados que violan los derechos de autor, como los descubiertos por Marcus, Southern y el New York Times, son raros o son errores que van a ser corregidos.

“Dicen: ‘Bueno, esto no sucede mucho. Necesitas dar indicaciones especiales.’ Pero las cosas que le preguntamos fueron bastante neutrales y aun así recibimos material protegido por derechos de autor, dice Marcus. “Ésta no es una cuestión secundaria menor: así es como se construyen los sistemas. Es existencial para estas empresas poder utilizar esta cantidad de datos”.

Finalmente, además de simplemente presentar argumentos en los tribunales y en declaraciones, las empresas de inteligencia artificial van a utilizar sus amplios recursos para ejercer presión entre bastidores y ejercer su poder para ayudar a presentar sus argumentos.

Una vez más, la industria de la IA generativa no está ganando mucho dinero todavía: el año pasado fue esencialmente una demostración masiva de productos para promocionar la tecnología. Y funcionó: los dólares de inversión llegaron a raudales. Pero eso no significa que las empresas de IA hayan descubierto formas de construir un modelo de negocio sostenible. Ya están operando bajo el supuesto de que no pagarán cosas como materiales de capacitación, licencias o mano de obra de los artistas.

Por supuesto, no es de ninguna manera cierto que empresas como Google, Microsoft o incluso OpenAI no puedan permitirse el lujo de pagar por utilizar obras protegidas por derechos de autor, pero Silicon Valley está en este momento acostumbrado a eliminar la mano de obra y el costo de las obras creativas fuera de la ecuación. , y tiene pocas razones para pensar que no podría volver a hacerlo. Desde Uber hasta Spotify, los modelos de negocio de muchas de las mayores empresas tecnológicas de este siglo se han construido sobre el supuesto de que los costos laborales podrían recortarse o minimizarse. Y cuando las industrias creativas argumentaron que YouTube permitía que proliferaran materiales pirateados y sin licencia a expensas de los trabajadores, y respaldaron la Ley para detener la piratería en línea (SOPA) para combatirla, Google jugó un papel decisivo a la hora de detener el proyecto de ley, organizando mítines y campañas en línea, y presionando. los legisladores abandonen el barco.

William Fitzgerald, socio de Worker Agency y ex miembro del equipo de políticas públicas de Google, me dice que ve que está tomando forma una campaña de presión similar para luchar contra los casos de derechos de autor, inspirada en el manual que Google ha utilizado con éxito en el pasado: Marshaling. grupos y órganos de terceros, como la Cámara del Progreso, para impulsar la idea de que el uso de obras protegidas por derechos de autor para la IA generativa no es sólo un uso legítimo, sino algo que está siendo adoptado por artistas ellos mismosno todos están tan obsesionados con cosas como querer que les paguen por su trabajo. Apunta a una IA progenerativa carta abierta firmado por artistas de IA, es decir, según uno de los artistas involucradosorganizado por Derek Slater, ex director de políticas de Google cuya empresa trabaja con Google, la misma persona que tomó crédito por organizar los esfuerzos anti-SOPA. Fitzgerald también ve las huellas de Google en la adopción por parte de Creative Commons del argumento de que el arte con IA es un uso legítimo, ya que Google es uno de los principales financiadores de la organización.

«Es preocupante ver a Google desplegar las mismas tácticas de lobby que ha desarrollado a lo largo de los años para garantizar que los trabajadores no reciban un pago justo por su trabajo», dijo Fitzgerald. Y OpenAI le sigue de cerca. No sólo está adoptando un enfoque similar al de Google para evitar las quejas de derechos de autor, sino que también está contratando a las mismas personas: contrató a Fred Von Lohmann, ex director de política de derechos de autor de Google, como su principal abogado de derechos de autor.

«Parece que OpenAI está replicando el manual de lobby de Google», afirma. «Han contratado a antiguos defensores de Google para aplicar el mismo manual que ha tenido tanto éxito para Google durante décadas».

Sin embargo, esta vez las cosas son diferentes. Había una verdadera animosidad popular contra SOPA, que en ese momento se consideraba diseñada por Hollywood y la industria musical; Silicon Valley todavía era muy querido como un inventor benevolente del futuro, y muchos no veían cómo tener el trabajo de un artista subido a una plataforma de vídeo propiedad de los buenos en Internet podría ser perjudicial para sus intereses económicos. (¡Aunque muchos lo hicieron!)

Sin embargo, ahora los trabajadores del mundo digital están mejor preparados. Todos, desde los guionistas de Hollywood hasta los ilustradores independientes, los redactores publicitarios a tiempo parcial y los codificadores a tiempo completo, pueden reconocer el efecto material potencial de un sistema de inteligencia artificial generativo que puede absorber su trabajo, replicarlo y ofrecerlo a los usuarios por una tarifa mensual, pagada a un Corporación de Silicon Valley, no ellos.

«Es pedir una donación enorme», dice Marcus. «Es el equivalente a una gran apropiación de tierras».

Ahora bien, hay muchos en Silicon Valley que, por supuesto, están genuinamente entusiasmados con el potencial de la IA, y muchos otros que son genuinamente ajenos a las cuestiones de economía política; que quieren ver los avances conseguidos lo antes posible y no se dan cuenta de cómo se utilizarán en la práctica estos sistemas de automatización del trabajo. A otros puede que simplemente no les importe. Pero para aquellos que sí lo hacen, Marcus dice que hay un camino sencillo a seguir.

«Aquí hay una alternativa obvia: OpenAI dice que necesitamos todo esto o no podemos construir IA, ¡pero podrían pagar por ello!» Nosotros desear un mundo con artistas y escritores, después de todo, añade, un mundo que recompensa el trabajo artístico, no un mundo en el que todo el dinero va a la cima porque un puñado de empresas tecnológicas ganaron la apropiación de tierras digitales.

“Depende de los trabajadores de todo el mundo ver esto tal como es, organizarse, educar a los legisladores y luchar para que se les pague justamente por su trabajo”, dice Fitzgerald. «Porque si no lo hacen, Google y OpenAI seguirán beneficiándose del trabajo y el contenido de otras personas durante mucho tiempo».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *