Cómo la IA imita las reseñas de restaurantes

Cómo la IA imita las reseñas de restaurantes

La pizza de almejas blancas en Frank Pepe Pizzeria Napoletana en New Haven, Connecticut, es una revelación. La corteza, besada por el intenso calor del horno de carbón, logra un equilibrio perfecto entre crujiente y masticable. Acompañado de almejas recién peladas, ajo, orégano y un poco de queso rallado, es un testimonio de la magia que pueden evocar ingredientes simples y de alta calidad.

¿Suena como yo? Que no es. El párrafo completo, excepto el nombre de la pizzería y la ciudad, fue generado por GPT-4 en respuesta a un simple mensaje que pedía una crítica de restaurante al estilo de Pete Wells.

Tengo algunas objeciones. Nunca consideraría ninguna comida como una revelación ni describiría el calor como un beso. No creo en la magia y rara vez llamo algo perfecto sin usar “casi” o alguna otra cobertura. Pero estos descriptores perezosos son tan comunes en los escritos sobre comida que imagino que muchos lectores apenas los notan. Estoy inusualmente en sintonía con ellos porque cada vez que cometo un cliché en mi copia, mi editor me golpea en las orejas.

No se dejaría engañar por el falso Pete. A mí tampoco. Pero por mucho que me duela admitirlo, supongo que mucha gente diría que es una falsificación de cuatro estrellas.

El responsable de Phony Me es Balazs Kovacsprofesor de comportamiento organizacional en la Escuela de Administración de Yale. En un estudio recienteenvió una gran cantidad de reseñas de Yelp a GPT-4, la tecnología detrás de ChatGPT, y le pidió que las imitara. Sus sujetos de prueba (las personas) no podían distinguir entre reseñas genuinas y aquellas generadas por inteligencia artificial. De hecho, era más probable que pensaran que las revisiones de IA eran reales. (El fenómeno de las falsificaciones generadas por computadora que son más convincentes que las reales es tan conocido que tiene un nombre: hiperrealismo de la IA).

El estudio del Dr. Kovacs pertenece a una creciente cuerpo de investigaciones que sugieren que las últimas versiones de IA generativa pueden pasar la prueba de Turing, un estándar científicamente confuso pero culturalmente resonante. Cuando una computadora puede engañarnos haciéndonos creer que el lenguaje que escupe fue escrito por un humano, decimos que ha pasado la prueba de Turing.

Durante mucho tiempo se ha asumido que la IA eventualmente pasaría la prueba propuesta por primera vez por el matemático Alan Turing en 1950. Pero incluso algunos expertos se sorprenden por la rapidez con la que está mejorando la tecnología. «Está sucediendo más rápido de lo que la gente esperaba», dijo el Dr. Kovacs.

La primera vez que el Dr. Kovacs pidió a GPT-4 que imitara a Yelp, pocos fueron engañados. La prosa era demasiado perfecta. Eso cambió cuando el Dr. Kovacs ordenó al programa que usara ortografía coloquial, enfatizara algunas palabras en mayúsculas e insertara errores tipográficos, uno o dos en cada reseña. Esta vez, GPT-4 pasó la prueba de Turing.

Además de marcar un umbral en el aprendizaje automático, la capacidad de la IA para sonar como nosotros tiene el potencial de socavar cualquier confianza que todavía tengamos en las comunicaciones verbales, especialmente las más breves. Los mensajes de texto, correos electrónicos, secciones de comentarios, artículos de noticias, publicaciones en redes sociales y reseñas de usuarios serán aún más sospechosos de lo que ya son. ¿Quién va a creer una publicación de Yelp sobre una pizza con croissant o un brillante envío de OpenTable sobre una degustación de sushi omakase de 400 dólares sabiendo que su autor podría ser una máquina que no puede masticar ni tragar?

«Con las reseñas generadas por los consumidores, siempre ha sido una gran pregunta quién está detrás de la pantalla», dijo Phoebe Ng, estratega de comunicaciones de restaurantes en la ciudad de Nueva York. «Ahora es una cuestión de qué hay detrás de la pantalla».

Las opiniones en línea son la grasa que impulsa el comercio moderno. En una encuesta de 2018 Según el Pew Research Center, el 57 por ciento de los estadounidenses encuestados dijeron que siempre o casi siempre leen reseñas y calificaciones en Internet antes de comprar un producto o servicio por primera vez. Otro 36 por ciento dijo que a veces lo hacía.

Para las empresas, unos pocos puntos en una calificación de estrellas en Google o Yelp pueden significar la diferencia entre ganar dinero y hundirse. “Vivimos de las reseñas”, me dijo la semana pasada el gerente de una sucursal de Enterprise Rent-a-Car en Brooklyn mientras recogía un auto.

Un viajero de negocios que necesita un viaje que no se averíe en la autopista de peaje de Nueva Jersey puede verse más influenciado por un informe negativo que, por ejemplo, alguien que simplemente busca un brunch. Aún así, para los dueños de restaurantes y chefs, Yelp, Google, TripAdvisor y otros sitios que permiten a los clientes expresar su opinión son una fuente de preocupación interminable y furia ocasional.

Una causa especial de frustración es el gran número de personas que no se molestan en comer en el lugar sobre el que escriben. Antes un artículo sobre Eater Como lo señaló la semana pasada, la primera ubicación en Nueva York de la cadena de dim sum con sede en Taiwán, Din Tai Fung, estaba recibiendo reseñas de una estrella en Google, lo que redujo su calificación promedio a 3,9 de 5 posibles. El restaurante no ha abierto todavía.

Algunos críticos fantasmas son más siniestros. Los restaurantes han recibido críticas de una estrella, seguidas de un correo electrónico ofreciendo eliminarlos a cambio de tarjetas de regalo.

Para luchar contra los ataques de mala fe, algunos propietarios reclutan a sus seres más cercanos y queridos para inundar la zona con propaganda positiva. «Una pregunta es: ¿cuántos alias tenemos todos los que trabajamos en la industria de la restauración?» dijo Steven Hall, propietario de una firma de relaciones públicas de Nueva York.

Un paso adelante respecto a una campaña organizada de relleno de votos, o tal vez un paso hacia abajo, es la práctica de intercambiar comidas compensadas o dinero en efectivo por artículos positivos. Más allá de eso se alza el vasto y sombrío reino de los críticos que no existen.

Para promocionar sus propios negocios o derrotar a sus rivales, las empresas pueden contratar intermediarios que han fabricado pequeños ejércitos de críticos ficticios. De acuerdo a Kay DeanComo defensor del consumidor que investiga el fraude en las reseñas en línea, estas cuentas generalmente reciben un historial extenso de reseñas anteriores que actúan como camuflaje para sus resultados de pago por juego.

En dos reciente vídeosSeñaló una cadena de clínicas de salud mental que habían recibido críticas entusiastas en Yelp, aparentemente enviadas por pacientes satisfechos cuyas cuentas estaban plagadas de reseñas de restaurantes extraídas palabra por palabra de TripAdvisor.

«Es un océano de falsedad, y mucho peor de lo que la gente cree», dijo Dean. «Los consumidores están siendo engañados, las empresas honestas están siendo perjudicadas y la confianza se está erosionando».

Todo esto lo están haciendo simples personas. Pero como escribe el Dr. Kovacs en su estudio, “la situación ahora cambia sustancialmente porque no se exigirá a los humanos que escriban reseñas que parezcan auténticas”.

Dean dijo que si el contenido generado por IA se infiltra en Yelp, Google y otros sitios, será «aún más difícil para los consumidores tomar decisiones informadas».

Los principales sitios dicen que tienen formas de descubrir las cuentas de Potemkin y otras formas de falsedad. Yelp invita a los usuarios a marcar reseñas dudosas y, después de una investigación, eliminará aquellas que violen sus políticas. También oculta reseñas que su algoritmo considera menos confiables. El año pasado, según su más reciente Informe de confianza y seguridadla empresa intensificó el uso de la IA «para detectar aún mejor y no recomendar reseñas menos útiles y menos confiables».

El Dr. Kovacs cree que los sitios tendrán que esforzarse más ahora para demostrar que no publican regularmente los pensamientos de los robots. Podrían, por ejemplo, adoptar algo como el Etiqueta «Compra verificada» que Amazon pega en reseñas de productos que se compraron o transmitieron a través de su sitio. Si los lectores sospechan aún más de las reseñas de restaurantes obtenidas mediante crowdsourcing de lo que ya lo son, podría ser una oportunidad para Mesa abierta y Perdidoque aceptan comentarios únicamente de aquellos comensales que se presentan a sus reservas.

Una cosa que probablemente no funcione es pedir a las computadoras que analicen el idioma por sí solas. El Dr. Kovacs pasó sus anuncios de Yelp reales y modificados a través de programas que se supone identifican la IA. Al igual que sus sujetos de prueba, dijo, el software «pensó que los falsos eran reales».

Esto no me sorprendió. Yo mismo realicé la encuesta del Dr. Kovacs, confiando en que sería capaz de detectar los pequeños detalles concretos que mencionaría un verdadero comensal. Después de hacer clic en una casilla para certificar que no era un robot, rápidamente me encontré perdido en un desierto de signos de exclamación y caras con el ceño fruncido. Cuando llegué al final de la prueba, sólo estaba adivinando. Identifiqué correctamente siete de 20 reseñas, un resultado entre lanzar una moneda y preguntarle a un mono.

Lo que me hizo tropezar fue que GPT-4 no inventó sus opiniones de la nada. Los unió a partir de fragmentos de las descripciones de los Yelpers sobre sus meriendas y almuerzos dominicales.

«No está totalmente compuesto en términos de las cosas que la gente valora y lo que les importa», dijo el Dr. Kovacs. «Lo que da miedo es que puede crear una experiencia que parece y huele como una experiencia real, pero no lo es».

Por cierto, el Dr. Kovacs me dijo que entregó el primer borrador de su artículo a un programa de edición de IA y tomó muchas de sus sugerencias en la copia final.

Probablemente no pasará mucho tiempo antes de que la idea de una revisión puramente humana parezca pintoresca. Se invitará a los robots a leer por encima de nuestros hombros, alertarnos cuando hayamos usado el mismo adjetivo demasiadas veces y empujarnos hacia un verbo más activo. Las máquinas serán nuestros maestros, nuestros editores, nuestros colaboradores. Incluso nos ayudarán a parecer humanos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *