Hiltzik: La revolución del chat con IA está revolucionando la ley de derechos de autor

Hiltzik: La revolución del chat con IA está revolucionando la ley de derechos de autor

Acabo de descubrir que soy parte de la revolución del chat con IA. Por favor no me odies.

Mi papel es el de autor de tres de los casi 200.000 libros que se introducen en el cerebro electrónico de LLaMa, el chatbot desarrollado y distribuido por Meta Platforms (anteriormente Facebook), en competencia con los más conocidos bots ChatGPT comercializados por OpenAI.

Alex Reisner del Atlántico compilado una práctica herramienta de búsqueda para la base de datosque se conoce como Books3, y brinda a los autores de todo el mundo la oportunidad de buscar sus nombres y decidir cómo pensar en los resultados.

¿Prohibiría la enseñanza (si esa es la palabra) de mis cuentos a las computadoras? Ni siquiera si pudiera.

– Stephen King

No lo he decidido del todo por mí mismo; por un lado, me molesta un poco que solo tres de mis siete libros supuestamente se han utilizado para “entrenar” a LLaMa; por el otro, me dedico a reflexionar sobre cuánto debería valer mi contribución y por qué no debería recibir un pago por ella.

Las reacciones de otros autores, destacados y no tan destacados, han estado por todas partes. Algunos han expresado una indignación convincente. Entre ellos se incluyen los novelistas John Grisham, George RR Martin, Scott Turow y otros que son miembros del Authors Guild y se encuentran entre los demandantes en una demanda por infracción de derechos de autor presentada contra OpenAIy Sarah Silverman, demandante en una demanda similar contra Metaplataformas.

Algunos han recurrido a las redes sociales para expresar su irritación o abierta furia, entre ellos Margarita Atwood y el novelista Laura Groff.

Luego está el grupo que pregunta: ¿cuál es el problema? Por ejemplo, Ian Bogost, autor o coautor de 10 libros, la mayoría sobre juegos, escribió un artículo reciente artículo para el Atlántico titulado “Mis libros se utilizaron para entrenar la IA generativa de Meta. Bien, también puede tener el próximo”.

Finalmente, está Stephen King, cuya reacción ante una base de datos que enumera 87 de sus obras parece ser algo parecido a la resignación. “¿Prohibiría la enseñanza (si esa es la palabra) de mis historias a las computadoras?” el escribe. “Ni siquiera si pudiera. Bien podría ser el rey Canuto, prohibiendo que suba la marea”.

Antes de profundizar más en las cuestiones legales, veamos qué significa la base de datos y su uso en el contexto de la «IA generativa», la categoría de tecnología a la que pertenecen estos chatbots.

Como he escrito antespara estos productos el término “inteligencia artificial” es inapropiado. No son inteligentes en el sentido en que los humanos y los animales lo son; simplemente están diseñados para parecer inteligentes ante un extraño que desconoce los procesos electrónicos que ocurren en su interior.

De hecho, utilizar el mismo término distorsiona nuestra percepción de lo que están haciendo. No están aprendiendo en ningún sentido real, como por ejemplo creando percepciones del mundo que los rodea basándose en la información que ya tienen en sus circuitos.

No son creativos en ningún sentido remotamente humano: «La creatividad no puede ocurrir sin sensibilidad», observa King, aunque cubre su apuesta respondiendo a su propia pregunta sobre si los sistemas son creativos con las palabras: «No». todavía.”

Los desarrolladores de chatbots “entrenan” sus sistemas infundiéndoles billones de palabras y frases presentes en Internet o en bases de datos especializadas; Cuando un chatbot responde a su pregunta, convoca una serie probabilística de esas entradas para producir algo que se parezca (a menudo sorprendentemente) a lo que un humano podría producir. Pero es más que nada un simulacro del pensamiento humano, no el producto de la meditación.

Lo gratificante de la revelación de que Books3 se ha utilizado para “entrenar” a LLaMa es que subraya cómo todo lo que arrojan los chatbots proviene, en esencia, de fuentes humanas.

Aunque OpenAI se niega a revelar qué utiliza para “entrenar” ChatGPT, es casi seguro que esté haciendo algo similar. (Meta no ha reconocido formalmente el uso de Books3, pero la función de la base de datos fue divulgado en un documento técnico por los desarrolladores de LLaMa en la empresa.

Otro punto importante a tener en cuenta es que ninguna de estas capacitaciones ha permitido a los desarrolladores resolver el problema más importante y persistente de los chatbots: hacen las cosas mal, a menudo de manera espectacular.

Cuando no pueden encontrar material factual para responder una pregunta, tienden a inventarla o citar irrelevancias; La semejanza de las respuestas con el pensamiento y el habla humanos induce a error a los usuarios a tomarlas al pie de la letra, lo que lleva a no pocos consecuencias embarazosas y costosas.

Esto es endémico en el campo de la IA en general. Tan recientemente como el 20 de septiembre, la prestigiosa revista Nature se retractó de un artículo de investigadores de Google que había informado que un sistema de inteligencia artificial necesitaba solo unas pocas horas para diseñar chips de computadora que requerían meses de trabajo por parte de diseñadores humanos. Según se informa, el autor del artículo concluyó que era todo lo contrario.

En mi caso, la triste verdad es que por muy rigurosamente “entrenado” que fuera LLaMa con mis libros, no parecía haber aprendido mucho. De hecho, sus respuestas a mis preguntas demostraron que era tan idiota como sus primos de la familia de la IA generativa.

Cuando le pregunté qué sabía de mí, su respuesta fue una mezcla de una biografía publicada en latimes.comjunto con la mención de tres libros, ninguno de los cuales figura en la base de datos de Books3: uno que no es mío (aunque estoy citado en sus notas finales) y dos que, por lo que puedo decir, no existen en todo. Sin embargo, sí me etiquetó como “un periodista consumado y muy respetado que ha hecho importantes contribuciones al campo del periodismo”, lo que sugiere que no carece del todo de sagacidad y buen juicio.

Cuando le pedí a LLaMa que describiera los tres libros que se encuentran en la base de datos Books3, sus respuestas se recopilaron a partir de textos repetitivos que podrían haber provenido de anuncios publicitarios en las portadas de los libros y errores absolutos, incluso extraños.

Esto nos lleva de nuevo a las preocupaciones planteadas en el mundo literario. Si las reacciones de los escritores establecidos parecen confusas, es principalmente porque la ley de derechos de autor es confusa. Esto es especialmente cierto cuando el tema es «uso legítimo». una exclusión de los derechos de autor que permite que partes de obras protegidas por derechos de autor se utilicen sin permiso.

El uso legítimo es lo que permite citar fragmentos de trabajos publicados en reseñas, resúmenes, informes de noticias o trabajos de investigación, o parodiarlos o reutilizarlos de una manera “transformativa”.

¿Qué es “transformador”? Como lo expresa un resumen de las bibliotecas de Stanford, “se han gastado millones de dólares en honorarios legales tratando de definir qué califica… No hay reglas duras y rápidassólo pautas generales y decisiones judiciales variadas”.

Esto es especialmente cierto cuando surge una nueva tecnología, como la reproducción digital o, ahora, el entrenamiento de chatbots.

La demanda presentada contra OpenAI por los novelistas y el Authors Guild afirma que OpenAI copió sus obras “al por mayor, sin permiso ni contraprestación”. [that is, payment]”, lo que equivale a “robo sistemático a gran escala”.

Los autores observan que la Oficina de Patentes de EE.UU. ha descubierto que la IA “la ‘formación’… casi por definición implica[s] la reproducción de obras enteras o de partes sustanciales de las mismas”. Dicen que “entrenar” es simplemente “un eufemismo que suena técnico para ‘copiar e ingerir’”.

Los autores dicen que los chatbots OpenAI «ponen en peligro la capacidad de los escritores de ficción para ganarse la vida», porque «permiten que cualquiera genere… textos que de otro modo pagarían a los escritores para que los crearan». Los robots «pueden escupir obras derivadas: material que se basa en las obras de los demandantes, las imita, las resume o las parafrasea, y perjudica el mercado de las mismas».

Se trata de afirmaciones cruciales, porque la interferencia con la comerciabilidad de una obra protegida por derechos de autor es un factor clave que pesa en contra de una defensa de uso legítimo ante los tribunales.

Vale la pena mencionar que la invasión de la IA en el mercado de habilidades profesionales fue un factor clave en la reciente huelga de escritores de Hollywood, y lo sigue siendo para los actores que aún están en huelga. Las limitaciones al uso de la IA son una disposición importante del contrato que resolvió la huelga de guionistas y seguramente serán parte de cualquier acuerdo con los actores.

La demanda presentada por Silverman y sus compañeros demandantes contra Meta sigue de cerca el caso del Authors Guild. Puede que no ayude a la defensa de Meta que Books3 sea en sí mismo un presunto producto de piratería; al menos algunas de las obras que contiene provienen de versiones ilícitas que circulan en la web. De hecho, un servidor de la base de datos la desconectó después una denuncia de una organización danesa antipiratería.

meta, en yoSu respuesta a la demanda de Silverman.sostiene que su uso de Books3 es “transformador por naturaleza y uso legítimo por excelencia”. (Su moción para desestimar el caso está programada para ser escuchada por un juez federal en San Francisco el 16 de noviembre). La compañía dice que los demandantes no pueden señalar «ningún ejemplo» de la producción de LLaMa que reproduzca alguna parte de su trabajo. . Puede que sea cierto, pero dependerá del juez Vincent Chhabria decidir si es relevante.

Meta también implica que le está haciendo un favor al mundo al desarrollar las capacidades de LLaMa, que, según dice, se encuentran entre «los casos más claros de los beneficios potenciales sustanciales que la IA puede ofrecer a escala a miles de millones de personas». Si esto suena un poco a las defensas de Meta contra las acusaciones de que ha infringido la privacidad de sus usuarios con fines de lucro (que sólo proporciona información a otros que harán del mundo un lugar mejor), probablemente no sea un accidente.

Bogost argumentó en The Atlantic que entrenar robots con material publicado y protegido por derechos de autor no debería requerir el permiso de sus creadores; que no es fundamentalmente diferente de lo que sucede cuando un lector recomienda un libro a un amigo o familiar. «Uno de los hechos (y placeres) de la autoría es que el trabajo de uno se utilizará de maneras impredecibles», escribe.

Pero en este contexto, eso es absurdo. Recomendar un libro no implica copiarlo. Incluso prestar o regalar un libro a otra persona es perfectamente lícito, ya que en algún momento del proceso el libro fue comprado, y una parte del precio de compra acabó en el bolsillo del autor.

Ese no es el caso aquí. OpenAI y Meta son empresas comerciales que esperan ganar dinero con sus chatbots. En la medida en que utilicen material protegido por derechos de autor para desarrollar su funcionalidad, les deben algo a los creadores.

Quizás ahora sé qué pensar sobre el uso de mis libros para “entrenar” estas máquinas, especialmente si nadie en la cadena Books3/Meta u OpenAI pagó por ellos. Puede ser difícil descubrir qué papel desempeñaron en la “capacitación”, pero sea cual fuere, no debería ser gratuito.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *