El equipo de investigación científica de NVIDIA Corp. ha encontrado la forma de entrenar modelos de inteligencia artificial usando sólo una fracción del material que normalmente se requiere.
El nuevo método, anunciado el 7 de diciembre, conlleva la aplicación de una técnica de entrenamiento especial de la popular red neural NVIDIA StyleGAN2 que se utiliza para entrenar a los generadores de imágenes basados en IA. Mediante esta técnica, los investigadores redujeron el número de imágenes utilizadas para entrenar los modelos de IA de 10 a 20 veces, sin dejar por ello de obtener excelentes resultados.
En un ejemplo, entrenaron un modelo de IA que generó obras de arte emulando a algunos de los pintores más renombrados del mundo. Otro recreó imágenes de tejido canceroso después de haber sido entrenado con menos de 1.500 imágenes.
El StyleGAN2 de NVIDIA, de código abierto, es la llamada red generativa adversarial que se ha utilizado para entrenar varios modelos de IA, incluyendo la app para pintar IA GauGAN, un imitador de motor de juego llamado GameGAN, y un transformador de fotos de mascotas conocido como GANimal. Consiste en dos redes de cooperación, incluyendo un generador que crea imágenes sintéticas, y un discriminador, que aprende cómo deben ser las imágenes realistas en base a los datos del entrenamiento.
Al igual que otras redes neuronales, StyleGAN sigue el principio básico de que cuantos más datos de entrenamiento reciba, más eficiente será el modelo de IA resultante. El discriminador entrena al generador, dándole retroalimentación píxel por píxel para ayudar a que las imágenes sintéticas que produce sean más realistas. Pero si StyleGAN sólo tiene datos de entrenamiento limitados de los que aprender, el discriminador no puede ayudar al generador a realizar todo su potencial.
Entrenar una GAN de alta calidad normalmente requiere de 50.000 a 100.000 imágenes de entrenamiento, dijo NVIDIA en un artículo de su blog. Pero en muchos casos, los investigadores no tienen tantas imágenes disponibles.
Es un problema conocido entre los expertos como “overfitting”, y la forma usual de evitarlo es aumentando los datos. Esa es una técnica utilizada para ampliar los conjuntos de datos usando copias de imágenes existentes que han sido distorsionadas al azar para forzar al modelo de IA a generalizar aún más. El problema radica en que el aumento de datos a menudo resulta en un generador de imágenes que sólo puede imitar esas distorsiones, en lugar de dar lugar a imágenes sintéticas creíbles.
Eso es lo que los investigadores de NVIDIA se propusieron arreglar con su nueva técnica Adaptive Discriminator Augmentation (ADA). El método ADA aplica el aumento de datos de forma adaptativa, lo que significa que la magnitud de la distorsión se ajusta en diferentes puntos del proceso de formación. NVIDIA dijo que esta técnica ayudó a la red neural StyleGAN2 a aprender usando un orden de magnitud de menos imágenes.
Los investigadores obtuvieron algunos resultados sorprendentes, incluyendo una versión de StyleGAN2 que produjo un estilo completamente nuevo de historietas basado en las ilustraciones del renombrado artista japonés Osamu Tezuka. StyleGAN2 también se aplicó al arte poco común del colectivo artístico AI Obvious, con sede en París, para crear un modelo que genera imágenes únicas de máscaras Kota africanas. Adobe Inc. ha utilizado StyleGAN2 para crear una nueva herramienta de IA para su software Photoshop, llamado Filtros Neurales.
Aunque todos estos ejemplos son bastante impresionantes, NVIDIA dijo que el verdadero potencial de la técnica ADA podría estar en la medicina. En tal sentido, la empresa indica que el problema es que hay muy pocas imágenes clínicas existentes de ciertos tipos de enfermedades poco frecuentes, incluyendo algunos cánceres, porque la mayoría de los exámenes y escaneos resultan normales. Por lo tanto es extremadamente difícil entrenar una IA que pueda ayudar a los médicos a detectar esas enfermedades.
“Estos resultados significan que la gente puede usar las GAN para abordar problemas en los que grandes volúmenes de datos consumen demasiado tiempo o son difíciles de obtener”, dijo David Luebke, vicepresidente de investigación de gráficos de NVIDIA.
NVIDIA dijo que la técnica ADA podría ayudar a llenar el vacío generando datos adicionales de entrenamiento para los modelos de IA que pueden luego detectar cánceres raros y otras condiciones en imágenes de patología o estudios de resonancia magnética. También hay una ventaja adicional, porque los datos generados por la IA significan que no hay datos de pacientes ni preocupaciones de privacidad, dijo NVIDIA. Eso significa que las instituciones de atención médica podrán compartir mejor los datos entre sí.
Ilustraciones: Fotogramas, presentación de NVIDIA en YouTube