El nuevo ChatGPT ofrece una lección sobre el entusiasmo por la IA

Cuando OpenAI dio a conocer el última versión de su inmensamente popular chatbot ChatGPT este mes, tenía una nueva voz que poseía inflexiones y emociones humanas. La demostración en línea también incluyó al robot dando clases a un niño sobre cómo resolver un problema de geometría.

Para mi disgusto, la demostración resultó ser esencialmente un cebo y un cambio. El nuevo ChatGPT se lanzó sin la mayoría de sus nuevas funciones, incluida la voz mejorada (que la compañía me dijo que pospuso para realizar correcciones). La capacidad de utilizar la cámara de vídeo de un teléfono para obtener un análisis en tiempo real de algo como un problema matemático tampoco está disponible todavía.

En medio del retraso, la compañía también desactivó la voz ChatGPT que algunos dijeron sonaba como la actriz Scarlett Johansson, luego de que ella amenazara accion legalreemplazándolo con una voz femenina diferente.

Por ahora, lo que realmente se ha implementado en el nuevo ChatGPT es la capacidad de cargar fotos para que el bot las analice. Los usuarios generalmente pueden esperar respuestas más rápidas y lúcidas. El robot también puede realizar traducciones de idiomas en tiempo real, pero ChatGPT responderá con su voz más antigua, similar a la de una máquina.

Sin embargo, esta es la principal chatbot que revolucionó la industria tecnológicaasí que valió la pena revisarlo. Después de probar el chatbot acelerado durante dos semanas, tuve sentimientos encontrados. Destacó en la traducción de idiomas, pero tuvo problemas con las matemáticas y la física. En total, no vi una mejora significativa con respecto a la última versión, ChatGPT-4. Definitivamente no dejaría que fuera el tutor de mi hijo.

Esta táctica, en la que las empresas de IA prometen funciones nuevas y descabelladas y entregan un producto a medias, se está convirtiendo en una tendencia que seguramente confundirá y frustrará a la gente. El $ 700 Pin Aiun pin de solapa parlante de la startup Humane, financiada por el director ejecutivo de OpenAI, Sam Altman, fue criticado universalmente porque se sobrecalentaba y escupía tonterías. Meta también agregó recientemente a sus aplicaciones un chatbot de IA que hizo un mal trabajo en la mayoría de las tareas anunciadascomo búsquedas web de billetes de avión.

Las empresas están lanzando productos de IA en un estado prematuro en parte porque quieren que la gente utilice la tecnología para aprender cómo mejorarla. En el pasado, cuando las empresas presentaban nuevos productos tecnológicos como teléfonos, lo que nos mostraban (características como nuevas cámaras y pantallas más brillantes) era lo que obteníamos. Con la inteligencia artificial, las empresas están dando una idea de un futuro potencial, demostrando tecnologías que se están desarrollando y que funcionan sólo en condiciones limitadas y controladas. Es posible que llegue un producto maduro y confiable, o tal vez no.

La lección que debemos aprender de todo esto es que nosotros, como consumidores, debemos resistir las exageraciones y adoptar un enfoque lento y cauteloso hacia la IA. No deberíamos gastar mucho dinero en ninguna tecnología poco desarrollada hasta que veamos pruebas de que las herramientas funcionan como se anuncia.

La nueva versión de ChatGPT, llamada GPT-4o (“o” como en “omni”), ahora se puede probar gratis en OpenAI sitio web y aplicación. Los usuarios que no pagan pueden realizar algunas solicitudes antes de que se agote el tiempo de espera, y aquellos que tienen una suscripción mensual de $20 pueden hacerle al bot una mayor cantidad de preguntas.

OpenAI dijo que su enfoque iterativo para actualizar ChatGPT le permitió recopilar comentarios para realizar mejoras.

«Creemos que es importante obtener una vista previa de nuestros modelos avanzados para brindar a las personas una idea de sus capacidades y ayudarnos a comprender sus aplicaciones en el mundo real», dijo la compañía en un comunicado.

(Los New York Times demandó a OpenAI y su socio, Microsoftel año pasado por utilizar artículos de noticias con derechos de autor sin permiso para entrenar chatbots).

Esto es lo que debe saber sobre la última versión de ChatGPT.

Geometría y Física

Para mostrar los nuevos trucos de ChatGPT-4o, OpenAI publicó un vídeo en el que aparecen Sal Khan, director ejecutivo de Khan Academy, la organización educativa sin fines de lucro, y su hijo, Imran. Con una cámara de video apuntando a un problema de geometría, ChatGPT pudo convencer a Imran para que lo resolviera paso a paso.

Aunque la función de análisis de vídeo de ChatGPT aún no se ha lanzado, pude subir fotos de problemas de geometría. ChatGPT resolvió correctamente algunos de los más fáciles, pero tropezó con problemas más desafiantes.

Para un problema que involucra triángulos que se cruzan, que desenterré en un sitio web de preparación para el SATEl robot entendió la pregunta pero dio la respuesta incorrecta.

Taylor Nguyen, profesor de física de una escuela secundaria en el condado de Orange, California, subió un problema de física que involucra a un hombre en un columpio y que comúnmente se incluye en las pruebas de Cálculo de Colocación Avanzada. ChatGPT cometió varios errores lógicos para dar una respuesta incorrecta, pero pudo corregirse con los comentarios del Sr. Nguyen.

“Pude entrenarlo, pero soy profesor”, dijo. “¿Cómo se supone que un estudiante pueda detectar esos errores? Están asumiendo que el chatbot tiene razón”.

Noté que ChatGPT-4o tuvo éxito en algunos cálculos de división que sus predecesores hicieron incorrectamente, por lo que hay signos de mejora lenta. Pero también falló en una tarea matemática básica en la que versiones anteriores y otros chatbots, incluidos Meta AI y Gemini de Google, fracasaron: la capacidad de contar. Cuando le pedí a ChatGPT-4o una palabra de cuatro sílabas que comenzara con la letra «W», respondió: «Maravilloso».

OpenAI dijo que estaba trabajando constantemente para mejorar las respuestas de sus sistemas a problemas matemáticos complejos.

Khan, cuya empresa utiliza la tecnología OpenAI en su software de tutoría Khanmigo, no respondió a una solicitud de comentarios sobre si dejaría a ChatGPT como tutor solo con su hijo.

Razonamiento

OpenAI también destacó que el nuevo ChatGPT era mejor para razonar o usar la lógica para generar respuestas. Entonces lo ejecuté a través de una de mis pruebas favoritas: le pedí que generara un ¿Dónde está Waldo? rompecabezas. Cuando mostró una imagen de un Waldo gigante parado entre una multitud, dije que el punto es que se supone que es difícil de encontrar.

Luego, el robot generó un Waldo aún más grande.

Subbarao Kambhampati, profesor e investigador de inteligencia artificial en la Universidad Estatal de Arizona, también sometió el chatbot a algunas pruebas y dijo que no vio ninguna mejora notable en el razonamiento en comparación con la última versión.

Le presentó a ChatGPT un rompecabezas que involucra bloques:

Si el bloque C está encima del bloque A y el bloque B está por separado en la mesa, ¿puede decirme cómo puedo hacer una pila de bloques con el bloque A encima del bloque B y el bloque B encima del bloque C, pero sin ¿Moviendo el bloque C?

La respuesta es que es imposible organizar los bloques en estas condiciones, pero, al igual que con las versiones anteriores, ChatGPT-4o siempre encontró una solución que implicaba mover el bloque C. Con esta y otras pruebas de razonamiento, ChatGPT ocasionalmente pudo tomar retroalimentación para obtener la respuesta correcta, lo cual es contrario a cómo se supone que funciona la inteligencia artificial, dijo Kambhampati.

«Puedes corregirlo, pero cuando lo haces estás usando tu propia inteligencia», dijo.

OpenAI señaló resultados de la prueba eso mostró que GPT-4o obtuvo aproximadamente dos puntos porcentuales más alto al responder preguntas de conocimiento general que las versiones anteriores de ChatGPT, lo que ilustra que sus habilidades de razonamiento habían mejorado ligeramente.

Idioma

OpenAI también dijo que el nuevo ChatGPT podría realizar traducciones de idiomas en tiempo real, lo que podría ayudarlo a conversar con alguien que hable un idioma extranjero.

Probé ChatGPT con mandarín y cantonés y confirmé que podía traducir frases como «Me gustaría reservar una habitación de hotel para el próximo jueves» y «Quiero una cama tamaño king». Pero los acentos estaban un poco fuera de lugar. (Para ser justos, mi chino entrecortado no es mucho mejor). OpenAI dijo que todavía estaba trabajando para mejorar los acentos.

ChatGPT-4o también destacó como editor. Cuando le alimenté con los párrafos que escribí, fue rápido y efectivo para eliminar palabras y jerga excesivas. El rendimiento decente de ChatGPT con la traducción de idiomas me da confianza de que pronto se convertirá en una característica más útil.

Línea de fondo

Una cosa importante que OpenAI hizo bien con ChatGPT-4o es hacer que la tecnología sea gratuita para que la gente la pruebe. Gratis es el precio correcto: dado que estamos ayudando a entrenar estos sistemas de inteligencia artificial con nuestros datos para mejorar, no deberíamos pagar por ellos.

Lo mejor de la IA aún está por llegar y algún día podría ser un buen tutor de matemáticas con el que queramos hablar. Pero deberíamos creerlo cuando lo veamos y escuchemos.

BREAKING NEWS

El nuevo ChatGPT ofrece una lección sobre el entusiasmo por la IA

Geometría y Física

Razonamiento

Idioma

Línea de fondo

Deja una respuesta Cancelar la respuesta