La nueva plataforma de IA generativa de NTT es capaz de analizar diagramas y gráficos

El gigante japonés de las telecomunicaciones Nippon Telegraph and Telephone Corp dice que su plataforma de inteligencia artificial generativa recientemente lanzada también puede analizar documentos que contengan gráficos y diagramas.

Tsuzumi, que lleva el nombre de un tambor japonés utilizado en eventos tradicionales, se lanzó el mes pasado para uso comercial mientras la importante empresa de telecomunicaciones busca alcanzar a sus rivales extranjeros en un mercado en rápida evolución.

Además de ser un modelo de IA multimodal, tsuzumi tiene mayores capacidades de procesamiento del idioma japonés que ChatGPT, un chatbot de IA ampliamente utilizado desarrollado por OpenAI, con sede en EE. UU., según NTT.

Con capacidades de comprensión visual, el modelo de lenguaje a gran escala de NTT puede resumir y extraer la información necesaria de una ilustración o gráfico.

La funcionalidad significa que también puede convertir un documento con muchos diagramas en texto o calcular gastos basándose en la tarifa del taxi o los recibos de comida.

Si bien las plataformas de inteligencia artificial desarrolladas por competidores extranjeros funcionan bien en la generación de imágenes o videos a partir de mensajes de texto y viceversa, el análisis de documentos que contienen diagramas y otros medios se ha considerado un desafío debido a las variaciones en los formatos de archivo.

«Si esta tecnología es ampliamente adoptada por las empresas, la productividad mejorará a pasos agigantados», afirmó un desarrollador de NTT.

© KYODO

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *