Meta presenta el nuevo modelo de IA Llama con la ayuda de Nvidia y otros

Meta presenta el nuevo modelo de IA Llama con la ayuda de Nvidia y otros

Meta El martes anunció la última versión de su Llama inteligencia artificial El modelo Llama 3.1 es el más reciente. La tecnología Llama viene en tres versiones diferentes, y una de ellas es el modelo de IA más grande y más capaz de Meta hasta la fecha. Al igual que las versiones anteriores de Llama, el modelo más reciente sigue siendo de código abierto, lo que significa que se puede acceder a él de forma gratuita.

El nuevo modelo de lenguaje grande, o LLM, subraya la inversión masiva de la red social para mantenerse a la par del gasto en IA con empresas emergentes de gran éxito como OpenAI y Anthropic y otros gigantes tecnológicos como Google y Amazon.

El anuncio también destaca la creciente asociación entre Meta y NvidiaNvidia es un socio clave de Meta, que proporciona a la empresa matriz de Facebook chips informáticos llamados GPU para ayudar a entrenar sus modelos de IA, incluida la última versión de Llama.

Si bien empresas como OpenAI buscan ganar dinero vendiendo el acceso a sus LLM patentados u ofreciendo servicios para ayudar a los clientes a utilizar la tecnología, Meta no tiene planes de lanzar su propio negocio empresarial competitivo, dijo un portavoz de Meta durante una conferencia de prensa.

En cambio, de manera similar a cuando se lanzó Meta Llama 2 el verano pasadoLa empresa se está asociando con un puñado de empresas tecnológicas que ofrecerán a sus clientes acceso a Llama 3.1 a través de sus respectivas plataformas de computación en la nube, además de vender herramientas de seguridad y gestión que funcionan con el nuevo software. Algunos de los 25 socios corporativos de Meta relacionados con Llama incluyen Amazon Web Services, Google Cloud, Microsoft Azure, Databricks y Dell.

Aunque el director ejecutivo de Meta, Mark Zuckerberg, ha dicho a los analistas durante anteriores conferencias de resultados corporativos que la empresa genera algunos ingresos a partir de sus asociaciones corporativas con Llama, un portavoz de Meta dijo que cualquier beneficio financiero es meramente incremental. En cambio, Meta cree que al invertir en Llama y tecnologías de IA relacionadas y haciéndolos disponibles de forma gratuita a través de código abierto, Puede atraer talento de alta calidad en un mercado competitivo y reducir sus costos generales de infraestructura informática, entre otros beneficios.

El lanzamiento de Llama 3.1 por parte de Meta se produce antes de una conferencia sobre gráficos de computadora avanzados en la que Zuckerberg y el CEO de Nvidia, Jensen Huang, tienen previsto hablar juntos.

El gigante de las redes sociales es uno de los principales clientes de Nvidia que no ejecuta su propia nube orientada al negocio, y Meta necesita Los últimos chips para entrenar sus modelos de IAque utiliza internamente para la segmentación y otros productos. Por ejemplo, Meta dijo que la versión más grande del modelo Llama 3.1 anunciado el martes fue entrenada en 16.000 procesadores gráficos H100 de Nvidia.

Pero la relación también es importante para ambas empresas por lo que representa.

Para Nvidia, el hecho de que Meta esté entrenando modelos de código abierto que otras empresas pueden usar y adaptar para sus negocios (sin pagar una tarifa de licencia ni pedir permiso) podría expandir el uso de los propios chips de Nvidia y mantener alta la demanda.

Pero los modelos de código abierto pueden cuestan cientos de millones o miles de millones de dólares para crearlos. No hay muchas empresas que tengan la capacidad financiera para desarrollar y lanzar esos modelos con cantidades similares de inversión. Google y OpenAI, aunque son clientes de Nvidia, mantienen en privado sus modelos más avanzados.

Meta, por otro lado, necesita un suministro confiable de Las últimas GPU Para entrenar modelos cada vez más potentes. Al igual que Nvidia, Meta está tratando de fomentar un ecosistema de desarrolladores que creen aplicaciones de IA con el software de código abierto de la empresa como eje central, incluso si Meta tiene que ceder código y los llamados pesos de IA, que son costosos de crear.

El enfoque de código abierto beneficia a Meta al exponer a los desarrolladores a sus herramientas internas e invitarlos a desarrollar sobre ellas, dijo a CNBC Ash Jhaveri, vicepresidente de asociaciones de IA de la empresa. También ayuda a Meta porque utiliza sus modelos de IA internamente, lo que permite a la empresa aprovechar las mejoras realizadas por la comunidad de código abierto, dijo.

Zuckerberg escribió en una publicación de blog el martes que estaba adoptando un «enfoque diferente» para el lanzamiento de Llama esta semana y agregó: «Estamos construyendo activamente asociaciones para que más empresas en el ecosistema también puedan ofrecer una funcionalidad única a sus clientes».

Como Meta no es un proveedor empresarial, puede derivar a las empresas que preguntan sobre Llama a uno de sus socios empresariales, como Nvidia, dijo Jhaveri.

La versión más grande de la familia de modelos Llama 3.1 se llama Llama 3.1 405B. Este LLM contiene 405 mil millones de parámetros, que se refieren a las variables que determinan el tamaño general del modelo y la cantidad de datos que puede procesar.

En términos generales, un LLM grande con una gran cantidad de parámetros puede realizar tareas más complicadas que los LLM más pequeños, como comprender el contexto en flujos de texto largos, resolver ecuaciones matemáticas complejas e incluso generar datos sintéticos que presumiblemente pueden usarse para mejorar modelos de IA más pequeños.

Meta también está lanzando versiones más pequeñas de Llama 3.1, llamadas Llama 3.1 8B y Llama 3.1 70B. Son esencialmente versiones mejoradas de sus predecesores y pueden usarse para impulsar chatbots y asistentes de codificación de software, dijo la compañía.

Meta también dijo que los usuarios de WhatsApp de la compañía con sede en Estados Unidos y los visitantes de su sitio web Meta.AI podrán presenciar las capacidades de Llama 3.1 al interactuar con el asistente digital de la compañía. El asistente digital, que se ejecutará en la última versión de Llama, podrá responder problemas matemáticos complicados o resolver problemas de codificación de software, explicó un portavoz de Meta.

Los usuarios de WhatsApp y Meta.AI que residan en EE. UU. podrán alternar entre el nuevo y gigantesco Llama 3.1 LLM o una versión menos capaz pero más rápida y más pequeña para obtener respuestas a sus consultas, dijo el portavoz de Meta.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *