NVIDIA anuncia Mellanox InfiniBand para supercomputación de IA a exaescala

Nueva generación de InfiniBand brinda a los desarrolladores de inteligencia artificial y científicos el rendimiento en red más rápido disponible.

“A medida que los requisitos de computación siguen creciendo exponencialmente en áreas como el descubrimiento de fármacos, la investigación climática y la genómica, NVIDIA Mellanox 400G InfiniBand está acelerando este trabajo a través de un salto espectacular en el rendimiento ofrecido mediante la única plataforma de computación en la red totalmente descargable del mundo”, escribe NVIDIA al anunciar la séptima generación de Mellanox InfiniBand.

La empresa recalca que el nuevo hardware proporciona una latencia ultrabaja y duplica la tasa de transferencia de datos con NDR 400 Gb/s. También agrega nuevos motores de computación en la red de NVIDIA para proporcionar una aceleración adicional.

Fabricantes de infraestructura tecnológica como Atos, Dell Technologies, Fujitsu, Inspur, Lenovo y Supermicro, planean integrar las soluciones NVIDIA Mellanox 400G InfiniBand en sus ofertas de HPC y soluciones empresariales. Estos compromisos se complementan con una amplia compatibilidad de parte de los principales socios de infraestructura de almacenamiento, como DDN e IBM Storage, entre otros.

“El trabajo más importante de nuestros clientes se basa en la inteligencia artificial y en aplicaciones cada vez más complejas que exigen redes más rápidas, inteligentes y escalables”, dijo Gilad Shainer, vicepresidente senior de redes de NVIDIA. “La enorme tasa de transferencia y los motores de aceleración inteligente de NVIDIA 400 Gb/s InfiniBand permiten que las infraestructuras de cloud de hiperescala, de IA y de HPC logren un rendimiento inigualable con menos costos y complejidad”.

El anuncio de hoy se basa en el liderazgo de Mellanox InfiniBand como la solución más robusta de la industria para supercomputo de IA. NVIDIA Mellanox NDR 400G InfiniBand ofrece el triple de densidad de puertos del switch y aumenta la potencia de aceleración de la IA en 32 veces. Además, aumenta 5 veces el rendimiento bidireccional combinado con el sistema de switches, hasta lograr 1.64 petabits por segundo. Esto les permite a los usuarios ejecutar cargas de trabajo más grandes con menos limitaciones. 

Expandir el Ecosistema para Expandir las Cargas de Trabajo
El interés inicial en la próxima generación de Mellanox InfiniBand proviene de algunas de las organizaciones de investigación científica más importantes del mundo.

“La asociación con Microsoft Azure y NVIDIA Networking se deriva de nuestra pasión compartida por ayudar a científicos e investigadores a impulsar la innovación y la creatividad a través de HPC e IA escalables. En HPC, las VM de Azure HBv2 son las primeras en llevar HDR InfiniBand al cloud y lograr una escala y un rendimiento de supercomputo para las aplicaciones de clients de MPI con una escalabilidad demostrada para eclipsar los 80,000 núcleos para HPC MPI”, dijo Nidhi Chappell, jefe de productos de Azure HPC e IA en Microsoft Corp. “En AI, para satisfacer las ambiciosas necesidades de la innovación de AI, las VM Azure NDv4 también aprovechan HDR InfiniBand con 200 Gb/s por GPU, un enorme total de 1.6 Tb/s de ancho de banda de interconexión por VM, y escalan a miles de GPUs con la misma estructura InfiniBand de baja latencia para llevar supercomputo de IA a las masas. Microsoft aplaude la innovación continua en la línea de productos Mellanox InfiniBand de NVIDIA y esperamos continuar nuestra sólida asociación juntos”.

“Las interconexiones de alto rendimiento son tecnologías fundamentales y necesarias para la exaescala y más. El Laboratorio Nacional de Los Alamos sigue estando a la vanguardia de las tecnologías de redes HPC”, dijo Steve Poole, arquitecto en jefe de plataformas de próxima generación del Laboratorio Nacional de Los Alamos. “El laboratorio continuará trabajando con NVIDIA en la evaluación y análisis de su última tecnología de 400 Gb/s destinada a resolver los diversos requisitos de cargas de trabajo en Los Alamos”.

“En medio de la nueva era de la computación a exaescala, los investigadores y científicos están superando los límites de la aplicación de modelos matemáticos a la química cuántica, la dinámica molecular y la seguridad civil”, dijo el profesor Thomas Lippert, director del Centro de Supercomputo de Jülich. “Estamos comprometidos a aprovechar la próxima generación de Mellanox InfiniBand para promover nuestro historial de desarrollo de supercomputadoras líderes en Europa de próxima generación”.

“InfiniBand mantiene su ritmo de innovación y rendimiento, destacando la diferenciación que lo ha convertido en el servidor de alto rendimiento y la interconexión de almacenamiento más comúnmente utilizados para sistemas de HPC e IA”, dijo Addison Snell, CEO de Intersect360 Research. “A medida que las aplicaciones continúan exigiendo un mayor rendimiento de la red, la necesidad de soluciones de alto rendimiento, como NVIDIA Mellanox 400G InfiniBand, tiene el potencial de seguir expandiéndose a nuevos casos de uso y mercados”.

Especificaciones y disponibilidad del Producto
La descarga de operaciones es crucial para las cargas de trabajo de IA. La tecnología NVIDIA Mellanox SHARP de tercera generación permite que las operaciones de entrenamiento de deep learning se descarguen y aceleren mediante la red InfiniBand, lo que da como resultado una potencia de aceleración de IA 32 veces mayor. Cuando se combina con la pila de software NVIDIA Magnum IO, proporciona computación científica acelerada lista para usar. 

Los switches de edge, basados en la arquitectura Mellanox InfiniBand, tienen un rendimiento bidireccional agregado de 51.2 Tb/s, con una capacidad histórica de más de 66,500 millones de paquetes por segundo. Los switches modulares, basados en Mellanox InfiniBand, lograrán hasta un rendimiento bidireccional combinado de 1.64 petabits por segundo, 5 veces más alto que el de la última generación.

La arquitectura Mellanox InfiniBand se basa en estándares de la industria para garantizar la compatibilidad con versiones anteriores y futuras, a fin de proteger las inversiones del data center. Se espera que las pruebas de las soluciones basadas en la arquitectura estén disponibles en el segundo trimestre de 2021.


Únase a la conversación

Contacto | Diario TI es una publicación de MPA Publishing International Ltd., Reino Unido. © Copyright 1997-2022