Investigadores proponen un modelo de IA para generar visuales a partir del cerebro

Un grupo de investigadores propone una novedosa técnica de IA de difusión estable para generar imágenes a partir de la actividad cerebral.

Los investigadores de la Escuela de Postgrado de Biociencias Avanzadas de la Universidad de Osaka afirman haber desarrollado un método único para reconstruir imágenes a partir de datos de resonancia magnética funcional (fMRI) derivados de la actividad cerebral humana utilizando un modelo de difusión (DM).

Los autores, Yu Takagi y Shinji Nishimoto, afirman que el método que proponen puede crear fotografías correctas y de alta resolución sin necesidad de entrenar y afinar más los sofisticados modelos de aprendizaje profundo.

Dado que las representaciones básicas del cerebro son en su mayoría desconocidas, reconstruir imágenes visuales a partir de la actividad cerebral detectada por la IRMf es una empresa ardua. Además, el tamaño de la muestra de datos cerebrales suele ser limitado.

Los modelos y algoritmos de aprendizaje profundo, como las redes generativas adversariales (GAN) y los enfoques de aprendizaje autosupervisado, han sido utilizados últimamente por los científicos para abordar esta dificultad.

Varios estudios han logrado mejorar la precisión incluyendo directamente el material semántico de las imágenes como entradas auxiliares en el proceso de reconstrucción.

Los investigadores japoneses proponen la difusión estable, un modelo de difusión latente (LDM) para recrear imágenes visuales a partir de datos de RMf.

La IA de difusión estable es un método de aprendizaje automático que puede analizar redes y sistemas complejos, como el cerebro humano.

La técnica se basa en los principios de los procesos de difusión, que modelan el movimiento y la difusión de partículas por un sistema a lo largo del tiempo. El método puede ser utilizado por los investigadores para comprender mejor cómo interactúan y procesan la información las distintas áreas cerebrales.

Según se indica, la arquitectura LDM de los investigadores se entrena en un gran conjunto de datos y demuestra un rendimiento “excelente” en la generación de texto a imagen.

Los investigadores utilizaron para su investigación el Conjunto de Datos de Escenas Naturales (NSD), que contiene datos adquiridos con un escáner fMRI de 7 Tesla a lo largo de 30-40 sesiones. Cada participante fue expuesto a tres repeticiones de 10.000 fotos a lo largo de estas sesiones. Los investigadores analizaron los datos de cuatro de los ocho participantes que tomaron parte en todas las sesiones de imagen.

Según los investigadores, los resultados ofrecen un “método prometedor” para recrear imágenes a partir de la actividad cerebral humana, así como un nuevo marco para comprender los modelos de difusión. El estudio también facilita un marco neurocientífico para cuantificar los distintos componentes del LDM.


Únase a la conversación

Contacto | Diario TI es una publicación de MPA Publishing International Ltd., Reino Unido. © Copyright 1997-2022