OpenAI añade funciones de voz e imagen a ChatGPT

ChatGPT entra en el ámbito de las interfaces multimodales con la introducción del soporte de voz e imagen. La función de voz estará disponible en iOS y Android, mientras que el soporte de imagen es independiente de la plataforma.

OpenAI está ampliando las capacidades de su popular IA conversacional, ChatGPT, con la incorporación del soporte de voz e imagen, con el objetivo de conseguir una interfaz de usuario más interactiva e intuitiva. Según la empresa, estas funciones mejoradas se introducirán gradualmente en las próximas dos semanas y estarán disponibles inicialmente para los abonados Plus y Enterprise.

En cuanto a la función de voz, OpenAI la pondrá a disposición de los sistemas operativos iOS y Android. Los usuarios tendrán que activar la función en los ajustes de su dispositivo. Una vez activada, se abrirá un sinfín de posibilidades, como entablar conversaciones interactivas con la IA. El componente de voz podría ser especialmente útil en diversos escenarios, desde la asistencia en tiempo real en las conversaciones de sobremesa hasta la narración de cuentos para niños a la hora de dormir. Esencialmente, la función de voz pretende simular una interacción más parecida a la humana, poniendo a ChatGPT en línea con otros asistentes de IA activados por voz como Siri de Apple.

En cuanto al soporte de imágenes, la función está diseñada para ser agnóstica con respecto a la plataforma, lo que significa que será accesible en todas las plataformas sin necesidad de que el usuario tenga que optar por ella. Las implicaciones de añadir la funcionalidad de imágenes a ChatGPT son de gran alcance. Los usuarios pueden hacer fotos de objetos o puntos de referencia y pedir a ChatGPT que les proporcione información o contexto sobre ellos. Una aplicación práctica podría ser en la cocina, donde un usuario podría fotografiar el contenido de su nevera y despensa y recibir sugerencias de comidas personalizadas. Además, esta función tiene potencial para ser una herramienta educativa. Por ejemplo, los padres podrían ayudar a sus hijos con problemas de matemáticas tomando una foto, rodeando el problema con un círculo y pidiendo después a ChatGPT pistas o soluciones.

La incorporación de estas funciones adicionales subraya la ambición de OpenAI de hacer de ChatGPT una herramienta más versátil, adecuada para una amplia gama de aplicaciones más allá de las consultas basadas en texto. Estas actualizaciones también ponen de relieve la tendencia creciente en la industria de la IA hacia interfaces multimodales diseñadas para ofrecer una experiencia de usuario más fluida e interactiva. Al añadir estas funciones, OpenAI no sólo está aumentando la utilidad de ChatGPT, sino que también está sentando las bases para una mayor innovación en la IA conversacional.


Únase a la conversación

Contacto | Diario TI es una publicación de MPA Publishing International Ltd., Reino Unido. © Copyright 1997-2022