NVIDIA anuncia Riva Speech AI y el modelado del lenguaje a gran escala para empresas

NVIDIA acaba de presentar los nuevos avances de NVIDIA Riva para la IA del habla y NVIDIA NeMo para el modelado del lenguaje a gran escala (LLM).

Riva es un SDK de IA de habla acelerada en la GPU para que las empresas puedan generar un habla expresiva similar a la humana para sus marcas y asistentes virtuales. NeMo es un entorno de entrenamiento acelerado para el habla y la NLU, que ahora tiene la capacidad de desarrollar modelos lingüísticos a gran escala con billones de parámetros.

Estos avances en la IA del habla y el lenguaje facilitan a las empresas y organismos de investigación la creación de capacidades de IA conversacional de última generación adaptadas a sus sectores y dominios.

NVIDIA ha anunciado una nueva versión con capacidad de voz personalizada, con la que las empresas pueden crear fácilmente una voz única que represente su marca con sólo 30 minutos de datos de voz.

Asimismo, NVIDIA ha anunciado Riva Enterprise, un programa de pago que incluye la asistencia de NVIDIA Expert para las empresas que necesiten implantar Riva a gran escala. Riva sigue estando disponible de forma gratuita para clientes y partners con cargas de trabajo más pequeñas.

Los aspectos más destacados son:

  • Creación de una nueva voz neural con 30 minutos de datos de audio en un día en A100.
  • Control detallado para generar voces expresivas.
  • Rendimiento 12 veces superior con Fastpitch + HiFiGAN en A100 frente a Tacotron2 + WaveGlow en V100.
  • Reconocimiento de voz de primera clase con soporte para otros cinco idiomas.
  • Escala a cientos y miles de flujos en tiempo real.
  • Funciona en cualquier nube, en las instalaciones y en el borde.

Más información en el sitio de desarrolladores de NVIDIA.



Contacto | Diario TI es una publicación de MPA Publishing International Ltd.