La casa matriz de ChatGPT anunció este lunes que está añadiendo capacidades de voz e imagen a esa plataforma de Inteligencia Artificial (IA) generativa, por largo tiempo limitada a indicaciones escritas.
Las funcionalidades, que están siendo agregadas a las versiones de pago de este servicio, permiten a los usuarios tener conversaciones con la IA e incluso «mostrarle» de lo que están hablando, de acuerdo con la empresa OpenAI.
«La voz y la imagen te dan más formas de usar ChatGPT en tu vida», dijo la compañía en una publicación.
«Toma una foto de un sitio emblemático mientras viajas y ten una conversación en directo sobre lo que tiene de interesante», añadió.
Los ejemplos sobre cómo las nuevas funciones pueden usarse incluyen desde hacer una foto del interior de un refrigerador para obtener sugerencias de recetas hasta una foto de la tarea de matemáticas de un niño para recibir ayuda resolviendo los problemas.
Las funciones de voz e imagen se implementarán para usuarios de ChatGPT Plus y Enterprise en las próximas semanas y, eventualmente, se desarrollarán para los sistemas operativos móviles de Apple y Google, de acuerdo con OpenAI.
Según la firma, las interacciones habladas se hicieron más realistas al contar con las voces de actores.
Leer también: El cable submarino transatlántico Nuvem de Google Cloud conectará Europa y América
Los programas de IA generativa, llamados así por su capacidad de crear texto, imágenes o contenidos complejos a partir de datos existentes, saltaron a la fama el año pasado con la habilidad de ChatGPT para generar ensayos, poemas y conversaciones a partir de breves indicaciones.
Los gigantes de la tecnología como Google, Meta y Microsoft compiten para entrar en la era de la IA generativa, mientras tratan de evitar los potenciales peligros de esta tecnología, como la desinformación y el cibercrimen.
Con información de Globovisión