Supercomputadoras de NVIDIA facilitan las simulaciones atómicas de COVID

Las supercomputadoras fabricadas con las plataformas más avanzadas de NVIDIA Corp. lideran la lucha contra la pandemia de coronavirus, ayudando a los investigadores a obtener más información sobre la naturaleza del virus SARS-CoV-2 y creando nuevos modelos de inteligencia artificial para acelerar el descubrimiento de fármacos.

NVIDIA reveló el 15 de noviembre cómo un equipo dirigido por Arvind Ramanathan, biólogo informático del Laboratorio Nacional de Argonne, ha diseñado un nuevo flujo de trabajo para estudiar el virus que se ejecuta en múltiples sistemas de supercomputación, incluido el Perlmutter, alimentado por la unidad de procesamiento gráfico NVIDIA A100.

La investigación proporciona una forma de mejorar la resolución de las herramientas tradicionales utilizadas para explorar las estructuras de las proteínas, lo que podría aportar nuevas ideas para detener la propagación de un virus.

El equipo de Ramanathan, integrado por una docena de organizaciones de EE.UU. y el Reino Unido, diseñó un flujo de trabajo ejecutado en sistemas que incluían Perlmutter, un sistema con tecnología NVIDIA A100, construido por Hewlett Packard Enterprise, y los sistemas NVIDIA DGX A100 de Argonne.

“La capacidad de realizar análisis de datos y simulaciones multisitio para la biología integradora tendrá un valor incalculable para hacer uso de grandes datos experimentales que son difíciles de transferir”, señalan los investigadores.

Como parte de su trabajo, el equipo desarrolló una técnica para acelerar la investigación en dinámica molecular utilizando el popular programa NAMD en las GPU. También aprovecharon NVLink de NVIDIA para acelerar los datos “mucho más de lo que es posible actualmente con una interconexión de red HPC convencional, o transferencias PCIe”.

Mil millones de átomos en alta fidelidad

Ivan Oleynik, profesor de física de la Universidad del Sur de Florida, dirigió un equipo nombrado finalista del premio estándar Gordon Bell por su trabajo de producción de la primera simulación de alta precisión de mil millones de átomos. Superó en 23 veces el récord establecido por un ganador del Gordon Bell el año pasado. “Es una alegría descubrir fenómenos nunca vistos, es un logro realmente grande del que estamos orgullosos”, dijo Oleynik.

La simulación de los átomos de carbono bajo temperaturas y presiones extremas podría abrir las puertas a nuevas fuentes de energía y ayudar a describir la composición de planetas lejanos. Es especialmente sorprendente porque la simulación tiene una precisión de nivel cuántico que refleja fielmente las fuerzas entre los átomos.

“Es una precisión que sólo podríamos conseguir aplicando técnicas de aprendizaje automático en una potente supercomputadora GPU: la IA está creando una revolución en la forma de hacer ciencia”, afirma Oleynik.

El equipo utilizó 4.608 servidores IBM Power AC922 y 27.900 GPUs NVIDIA en la supercomputadora Summit del Departamento de Energía de EE.UU., construida por IBM, una de las más potentes del mundo. Demostraron que su código podía escalar con una eficiencia de casi el 100 por cien hasta simulaciones de 20.000 millones de átomos o más.

Ese código está a disposición de cualquier investigador que quiera ampliar los límites de la ciencia de los materiales.

En otra simulación de mil millones de átomos, un segundo finalista del premio COVID-19 mostró la variante Delta en una gota de aire, revelando las fuerzas biológicas que propagan el COVID y otras enfermedades, proporcionando una primera visión a nivel atómico de los aerosoles.

El trabajo tiene “implicaciones de gran alcance para la unión viral en el pulmón profundo, y para el estudio de otros patógenos transportados por el aire”, explicaron los científicos. En el estudio se simuló el virus Delta SARS-CoV-2 en una gota respiratoria con más de mil millones de átomos. “Demostramos cómo la IA acoplada a la HPC en múltiples niveles puede dar lugar a una mejora significativa del rendimiento efectivo, permitiendo nuevas formas de entender e interrogar sistemas biológicos complejos”, señaló el investigador Rommie Amaro, de la Universidad de California en San Diego.

Los investigadores utilizaron las GPU NVIDIA en Summit, el superordenador Longhorn construido por Dell Technologies para el Texas Advanced Computing Center y los sistemas comerciales de la nube de Oracle.

“Los recursos de HPC y la nube pueden utilizarse para reducir significativamente el tiempo de resolución de los grandes esfuerzos científicos, así como para conectar a los investigadores y facilitar enormemente las complejas interacciones de colaboración”, concluye el equipo.

El lenguaje del descubrimiento de fármacos

Los finalistas del premio COVID del Laboratorio Nacional de Oak Ridge (ORNL) aplicaron el procesamiento del lenguaje natural (PLN) al problema del cribado de compuestos químicos en busca de nuevos fármacos.

Utilizaron un conjunto de datos con 9.600 millones de moléculas -el mayor conjunto de datos aplicado a esta tarea hasta la fecha- para entrenar en dos horas un modelo de PNL BERT que puede acelerar el descubrimiento de nuevos fármacos. Los mejores esfuerzos anteriores requerían cuatro días para entrenar un modelo utilizando un conjunto de datos con 1.100 millones de moléculas.

El trabajo empleó más de 24.000 GPUs NVIDIA del superordenador Summit para obtener la friolera de 603 petaflops. Ahora que el entrenamiento está terminado, el modelo puede ejecutarse en una sola GPU para ayudar a los investigadores a encontrar compuestos químicos que puedan inhibir la COVID y otras enfermedades.

“Tenemos colaboradores que quieren aplicar el modelo a los circuitos de señales del cáncer”, afirma Jens Glaser, científico computacional del ORNL.

“Sólo estamos arañando la superficie de los tamaños de los datos de entrenamiento; esperamos utilizar pronto un billón de moléculas”, dijo Andrew Blanchard, un científico investigador que dirigió el equipo.

Una solución completa

Las librerías de software de NVIDIA para la IA y la computación acelerada ayudaron al equipo a completar su trabajo en lo que un observador calificó de sorprendente rapidez.

“No tuvimos que optimizar completamente nuestro trabajo para los núcleos tensoriales de la GPU porque no hace falta código especializado, basta con utilizar la pila estándar”, afirma Glaser.

Resumió lo que sintieron muchos de los finalistas: “Tener la oportunidad de formar parte de una investigación significativa con potencial impacto en la vida de las personas es algo muy satisfactorio para un científico”.

Ilustración: NVIDIA