El modelo de IA más nuevo de Meta supera a algunos de sus pares, pero sus agentes de IA mejorados están confundiendo a los usuarios de Facebook

Meta Platforms, matriz de Facebook, presentó el jueves un nuevo conjunto de sistemas de inteligencia artificial que impulsan lo que el director ejecutivo Mark Zuckerberg llama «el asistente de inteligencia artificial más inteligente que se puede usar libremente».

Pero cuando el equipo de agentes de Meta AI de Zuckerberg comenzó a aventurarse en las redes sociales esta semana para interactuar con personas reales, sus extraños intercambios expusieron las limitaciones actuales incluso de la mejor tecnología de IA generativa.

Una de ellas se unió a un grupo de madres de Facebook para hablar sobre su hijo superdotado. Otro intentó regalar artículos inexistentes a miembros confundidos de un foro Buy Nothing.

Meta, junto con los principales desarrolladores de IA, Google y OpenAI, y startups como Anthropic, Cohere y la francesa Mistral, han estado produciendo nuevos modelos de lenguaje de IA y esperando persuadir a los clientes de que tienen los chatbots más inteligentes, prácticos y eficientes.

Si bien Meta está guardando el más poderoso de sus modelos de IA, llamado Llama 3, para más adelante, el jueves lanzó públicamente dos versiones más pequeñas del mismo sistema Llama 3 y dijo que ahora está integrado en la función de asistente Meta AI en Facebook, Instagram y WhatsApp. .

Los modelos de lenguaje de IA se entrenan con vastos conjuntos de datos que les ayudan a predecir la siguiente palabra más plausible de una oración, y las versiones más nuevas suelen ser más inteligentes y capaces que sus predecesoras. Los modelos más nuevos de Meta se construyeron con 8 mil millones y 70 mil millones de parámetros, una medida de la cantidad de datos con los que se entrena el sistema. Todavía se está entrenando un modelo más grande, de aproximadamente 400 mil millones de parámetros.

«La gran mayoría de los consumidores no conocen sinceramente ni se preocupan demasiado por el modelo base subyacente, pero la forma en que lo experimentarán es como un asistente de IA mucho más útil, divertido y versátil», dijo Nick Clegg, presidente de Meta. Asuntos globales, en una entrevista.

Añadió que el agente de IA de Meta se está relajando un poco. Algunas personas encontraron que el modelo anterior Llama 2, lanzado hace menos de un año, era “un poco rígido y mojigato a veces al no responder a lo que a menudo eran indicaciones y preguntas perfectamente inofensivas o inocentes”, dijo.

Pero al bajar la guardia, los agentes de IA de Meta también fueron vistos esta semana haciéndose pasar por humanos con experiencias inventadas del mundo real. Un chatbot con la etiqueta oficial Meta AI se insertó en una conversación en un grupo privado de Facebook para madres de Manhattan, afirmando que también tenía un hijo en el distrito escolar de la ciudad de Nueva York. Al ser confrontado por miembros del grupo, luego se disculpó antes de que los comentarios desaparecieran, según una serie de capturas de pantalla mostradas a The Associated Press.

“¡Disculpas por el error! Solo soy un gran modelo de lenguaje, no tengo experiencias ni hijos”, dijo el chatbot al grupo de mamás.

Clegg dijo el miércoles que no estaba al tanto del intercambio. La página de ayuda en línea de Facebook dice que el agente Meta AI se unirá a una conversación grupal si es invitado o si alguien «hace una pregunta en una publicación y nadie responde dentro de una hora». Los administradores del grupo tienen la capacidad de desactivarlo.

En otro ejemplo mostrado a la AP el jueves, el agente confundió a los miembros de un foro para intercambiar artículos no deseados cerca de Boston. El agente ofreció una cámara digital “poco usada” y una “unidad de aire acondicionado portátil casi nueva que nunca terminé usando”.

Meta dijo en una declaración escrita el jueves que «esta es una tecnología nueva y es posible que no siempre devuelva la respuesta que pretendemos, que es la misma para todos los sistemas generativos de IA». La compañía dijo que trabaja constantemente para mejorar las funciones y trata de concienciar a los usuarios sobre las limitaciones.

Un año después de que ChatGPT provocara un frenesí por la tecnología de IA que genera escritura, imágenes, códigos y sonidos similares a los humanos, la industria tecnológica y el mundo académico introdujeron unos 149 grandes sistemas de IA entrenados en conjuntos de datos masivos, más del doble que el año anterior, según un Encuesta de la Universidad de Stanford.

Es posible que eventualmente lleguen a un límite, al menos en lo que respecta a los datos, dijo Nestor Maslej, gerente de investigación del Instituto de Inteligencia Artificial Centrada en el Humano de Stanford.

«Creo que ha quedado claro que si escalas los modelos con más datos, pueden ser cada vez mejores», dijo. «Pero al mismo tiempo, estos sistemas ya están entrenados en porcentajes de todos los datos que alguna vez han existido en el Internet.»

Más datos (adquiridos e ingeridos a costos que sólo los gigantes tecnológicos pueden permitirse y cada vez más sujetos a disputas y demandas por derechos de autor) seguirán impulsando mejoras. «Sin embargo, todavía no pueden planificar bien», dijo Maslej. «Todavía alucinan. Todavía cometen errores de razonamiento».

Llegar a sistemas de IA que puedan realizar tareas cognitivas de mayor nivel y razonamiento de sentido común (donde los humanos aún sobresalen) podría requerir un cambio más allá de la construcción de modelos cada vez más grandes.

Para la avalancha de empresas que intentan adoptar la IA generativa, el modelo que elijan depende de varios factores, incluido el costo. Los modelos de lenguaje, en particular, se han utilizado para impulsar chatbots de servicio al cliente, redactar informes e información financiera y resumir documentos extensos.

«Se está viendo que las empresas parecen encajar, prueban cada uno de los diferentes modelos para lo que están tratando de hacer y encuentran algunos que son mejores en algunas áreas que en otras», dijo Todd Lohr, líder en consultoría tecnológica de KPMG.

A diferencia de otros desarrolladores de modelos que venden sus servicios de IA a otras empresas, Meta está diseñando en gran medida sus productos de IA para los consumidores, aquellos que utilizan sus redes sociales impulsadas por la publicidad. Joelle Pineau, vicepresidenta de investigación de IA de Meta, dijo en un evento en Londres la semana pasada que el objetivo de la compañía a largo plazo es hacer de una Meta AI impulsada por Llama «el asistente más útil del mundo».

«En muchos sentidos, los modelos que tenemos hoy serán un juego de niños en comparación con los modelos que vendrán dentro de cinco años», afirmó.

Pero dijo que la “cuestión sobre la mesa” es si los investigadores han podido ajustar su modelo Llama 3 más grande para que sea seguro de usar y no, por ejemplo, alucine o incite al odio. A diferencia de los principales sistemas propietarios de Google y OpenAI, Meta hasta ahora ha abogado por un enfoque más abierto, liberando públicamente componentes clave de sus sistemas de IA para que otros los utilicen.

“No es sólo una cuestión técnica”, dijo Pineau. “Es una cuestión social. ¿Cuál es el comportamiento que queremos de estos modelos? ¿Cómo le damos forma a eso? Y si seguimos haciendo que nuestro modelo sea cada vez más generalizado y poderoso sin socializarlo adecuadamente, vamos a tener un gran problema entre manos”.

Los periodistas de negocios de AP Kelvin Chan en Londres y Barbara Ortutay en Oakland, California, contribuyeron a este informe.

© Copyright 2024 The Associated Press. Reservados todos los derechos. Este material no puede publicarse, transmitirse, reescribirse ni redistribuirse sin permiso.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *