Los modelos de lenguaje natural podrían explicar el origen de las enfermedades

El aprendizaje automático puede liberarse de las limitaciones inherentes de los investigadores, y así la IA dessarrollará fármacos por cuenta propia.

Un estudio de la Universidad de Cambridge ha demostrado que los modelos de procesamiento del lenguaje natural tienen el potencial de descifrar el “lenguaje biol√≥gico” del Alzheimer y otras enfermedades neurodegenerativas, lo que podr√≠a desempe√Īar un papel en la investigaci√≥n m√©dica para el que los humanos son incapaces.

Los investigadores adoptaron un enfoque similar al utilizado por las empresas tecnológicas para generar predicciones basadas en el comportamiento previo de los usuarios, como el texto sugerido en los correos electrónicos y mensajes o las recomendaciones de contenido.

Kadi Liis Saar, primera autora del estudio, entren√≥ un modelo ling√ľ√≠stico a gran escala para ver qu√© ocurre cuando las prote√≠nas act√ļan incorrectamente causando enfermedades. Las prote√≠nas son mol√©culas grandes y complejas, fundamentales para la funci√≥n, la estructura y la regulaci√≥n de los tejidos y √≥rganos del cuerpo.

“El cuerpo humano alberga miles y miles de prote√≠nas y los cient√≠ficos a√ļn no conocen la funci√≥n de muchas de ellas. Le pedimos a un modelo de lenguaje basado en redes neuronales que aprendiera el lenguaje de las prote√≠nas”, explic√≥. “En concreto, pedimos al programa que aprendiera el lenguaje de los condensados biomoleculares cambiantes -gotas de prote√≠nas que se encuentran en las c√©lulas- que los cient√≠ficos realmente necesitan comprender para descifrar el lenguaje de la funci√≥n biol√≥gica y el mal funcionamiento que causan el c√°ncer y las enfermedades neurodegenerativas como el Alzheimer”.

“Descubrimos que pod√≠a aprender, sin que se le dijera expl√≠citamente, lo que los cient√≠ficos ya hab√≠an descubierto sobre el lenguaje de las prote√≠nas durante d√©cadas de investigaci√≥n”.

Una de las √°reas en las que se centraron los cient√≠ficos fue el comportamiento de las prote√≠nas en enfermedades neurodegenerativas como el Alzheimer, el Parkinson y la enfermedad de Huntington. En la enfermedad de Alzheimer, las prote√≠nas se vuelven “rebeldes”, forman grupos y matan a las c√©lulas nerviosas sanas; un cerebro sano tiene un sistema para eliminar eficazmente estas peligrosas masas de prote√≠nas (agregados). Los cient√≠ficos creen que algunas prote√≠nas desordenadas tambi√©n forman gotas de prote√≠nas llamadas condensados que no tienen membrana y que se fusionan libremente entre s√≠. A diferencia de los agregados de prote√≠nas, los condensados de prote√≠nas pueden formarse y reformarse.

Los investigadores introdujeron todos los datos que ten√≠an sobre las prote√≠nas conocidas, de modo que su modelo pudiera aprender a predecir el “lenguaje de las prote√≠nas” del mismo modo que los modelos aprenden a predecir el lenguaje humano. A partir de estos datos, los investigadores pudieron explorar los patrones que hacen que s√≥lo ciertas prote√≠nas formen condensados. Desbloquear esta comprensi√≥n ayudar√° a los cient√≠ficos a aprender las “reglas del lenguaje de las enfermedades”.

“Los condensados de prote√≠nas han atra√≠do recientemente mucha atenci√≥n en el mundo cient√≠fico porque controlan acontecimientos clave en la c√©lula como la expresi√≥n g√©nica [c√≥mo nuestro ADN se convierte en prote√≠nas] y la s√≠ntesis de prote√≠nas [c√≥mo las c√©lulas fabrican prote√≠nas]”, dijo el profesor Tuomas Knowles, autor principal del estudio. “Cualquier defecto relacionado con estas gotas de prote√≠na puede dar lugar a enfermedades como el c√°ncer.

“Por eso, introducir la tecnolog√≠a de procesamiento del lenguaje natural en la investigaci√≥n de los or√≠genes moleculares del mal funcionamiento de las prote√≠nas es vital si queremos ser capaces de corregir los errores gramaticales dentro de las c√©lulas que causan enfermedades”.

Este enfoque podr√≠a, con el uso de modelos potentes y eficientes, conducir a descubrimientos originales, teor√≠as de la enfermedad y metas farmacol√≥gicas m√°s all√° de lo que ser√≠a factible para los investigadores que trabajan sin estas herramientas. Saar explic√≥: “El aprendizaje autom√°tico puede liberarse de las limitaciones de lo que los investigadores creen que son los objetivos de la exploraci√≥n cient√≠fica y significar√° que se encontrar√°n nuevas conexiones que a√ļn no hemos concebido. Es realmente muy emocionante”.

Knowles a√Īadi√≥: “Introducir la tecnolog√≠a de aprendizaje autom√°tico en la investigaci√≥n de las enfermedades neurodegenerativas y el c√°ncer es un avance absoluto. En √ļltima instancia, el objetivo ser√° utilizar la inteligencia artificial para desarrollar f√°rmacos espec√≠ficos que alivien dr√°sticamente los s√≠ntomas o impidan que se produzca la demencia”.

Ilustración: H. Heyerlein vía Unsplash




Contacto | Diario TI es una publicación de MPA Publishing International Ltd.