NVIDIA anuncia Riva Speech AI y el modelado del lenguaje a gran escala para empresas

11/11/2021

Riva es un SDK de IA de habla acelerada en la GPU para que las empresas puedan generar un habla expresiva similar a la humana para sus marcas y asistentes virtuales. NeMo es un entorno de entrenamiento acelerado para el habla y la NLU, que ahora tiene la capacidad de desarrollar modelos lingüísticos a gran escala con billones de parámetros.

Estos avances en la IA del habla y el lenguaje facilitan a las empresas y organismos de investigación la creación de capacidades de IA conversacional de última generación adaptadas a sus sectores y dominios.

NVIDIA ha anunciado una nueva versión con capacidad de voz personalizada, con la que las empresas pueden crear fácilmente una voz única que represente su marca con sólo 30 minutos de datos de voz.

Asimismo, NVIDIA ha anunciado Riva Enterprise, un programa de pago que incluye la asistencia de NVIDIA Expert para las empresas que necesiten implantar Riva a gran escala. Riva sigue estando disponible de forma gratuita para clientes y partners con cargas de trabajo más pequeñas.

Los aspectos más destacados son:

Creación de una nueva voz neural con 30 minutos de datos de audio en un día en A100.
Control detallado para generar voces expresivas.
Rendimiento 12 veces superior con Fastpitch + HiFiGAN en A100 frente a Tacotron2 + WaveGlow en V100.
Reconocimiento de voz de primera clase con soporte para otros cinco idiomas.
Escala a cientos y miles de flujos en tiempo real.
Funciona en cualquier nube, en las instalaciones y en el borde.

Más información en el sitio de desarrolladores de NVIDIA.

NVIDIA presenta motor de generación de datos sintéticos Omniverse para el entrenamiento de IAs

📬 Newsletter gratuito

Últimos artículos

IAInformes

NVIDIA anuncia Riva Speech AI y el modelado del lenguaje a gran escala para empresas

Últimos artículos

La adopción empresarial de IA avanza, pero continúa fragmentada, según un estudio de SAP

La adopción de agentes de IA expone debilidades en los controles de identidad, según un estudio de IDC

Google estaría desarrollando Frozen v2, un chip especializado para la arquitectura de Gemini

El avance de Kimi reabre en Washington el debate sobre los modelos chinos de IA

Fusión en la industria de identidad digital: Veridas y Fourthline unen biometría y cumplimiento regulatorio

Anthropic pone fin al acceso incluido a Claude Fable 5 y lo compensa con créditos únicos de US$100

Ciberseguridad y pagos digitales: el desafío que Chile no puede postergar

Moonshot presenta Kimi K3, un modelo de 2,8 billones de parámetros orientado al trabajo autónomo

Gemini Omni llega a Google Vids para generar y modificar videos mediante instrucciones orales