Cloud-AI de NVIDIA perfila nueva era para las videoconferencias

La plataforma de IA acelerada por la GPU, NVIDIA Maxine mejora radicalmente la calidad de la transmisi贸n, con s煤per resoluci贸n, correcci贸n de la mirada y subt铆tulos en tiempo real.

NVIDIA ha presentado hoy la plataforma NVIDIA Maxine, que proporciona a los desarrolladores un paquete de software de videoconferencia de IA acelerado en la GPU para mejorar la transmisi贸n de v铆deo.

Entre los efectos anunciados hoy en GPU Technology Conference, figuran la correcci贸n de la mirada, superresoluci贸n, cancelaci贸n de ruido y la reiluminaci贸n de rostros. Debido a que los datos se procesan en la nube en lugar de los dispositivos locales, los usuarios finales pueden disfrutar de las nuevas caracter铆sticas sin necesidad de utilizar equipos especializados.

Maxine reduce dr谩sticamente el ancho de banda necesario para las videollamadas. En lugar de transmitir toda la pantalla de p铆xeles, el software de IA analiza los puntos faciales clave de cada persona en una llamada y luego reconstruye inteligentemente el rostro en la pantalla del receptor. Esto hace posible reducir considerablemente la transmisi贸n datos entre los participantes en la videoconferencia.

Utilizando esta nueva tecnolog铆a de compresi贸n de video basada en la IA y ejecutada en las GPU de NVIDIA, los desarrolladores pueden reducir el consumo de ancho de banda de video a una d茅cima parte de los requerimientos del est谩ndar de compresi贸n de video H.264. Para los usuarios finales, esto constituye una experiencia de videoconferencia m谩s fluida, ya que pueden disfrutar de m谩s servicios basados en la IA mientras transmiten menos datos en sus computadoras, tabletas y tel茅fonos.

Los nuevos avances cient铆ficos de NVIDIA incluidos en Maxine hacen que la videoconferencia se sienta m谩s como una conversaci贸n cara a cara. La empresa ezxplica que los proveedores de servicios de videoconferencia podr谩n aprovechar las investigaciones de NVIDIA en las GAN, o redes generativas antag贸nicas, para ofrecer una variedad de nuevas funciones. Por ejemplo, la alineaci贸n de las caras permite ajustarlas autom谩ticamente para que las personas parezcan estar frente a frente durante la llamada, mientras que la correcci贸n de la mirada ayuda a simular el contacto visual, incluso si la c谩mara no est谩 alineada con la pantalla del usuario.
Con la videoconferencia creciendo 10 veces desde principios de a帽o, estas caracter铆sticas ayudan a las personas a concentrarse en la conversaci贸n en lugar de mirar a la c谩mara.

Los desarrolladores tambi茅n pueden a帽adir funciones que permiten a los participantes en la llamada elegir sus propios avatares animados con animaci贸n realista impulsada autom谩ticamente por su voz y tono emocional en tiempo real. Una opci贸n de fotograma autom谩tico permite que la imagen de video siga al orador incluso si se aleja de la pantalla.

Los desarrolladores pueden adem谩s integrar asistentes virtuales que utilizan modelos de lenguaje de IA de 煤ltima generaci贸n para el reconocimiento y la comprensi贸n del lenguaje y la generaci贸n del habla. Los asistentes virtuales pueden tomar notas, establecer puntos de acci贸n y responder a preguntas con voces humanas. Los servicios adicionales de IA conversacional, como traducciones, subt铆tulos y transcripciones, ayudan a asegurar que los participantes puedan entender lo que se est谩 discutiendo en la llamada.

Ilustraci贸n: fotograma, presentaci贸n de NVIDIA en YouTube.


Destacamos

Contacto | Diario TI es una publicaci贸n de MPA Publishing International Ltd.