La inteligencia artificial está aprendiendo lo que significa tener vida

Imagen: Credit…Doug Chayka

A partir de una gran cantidad de datos sobre genes y células, los modelos de IA han hecho algunos descubrimientos sorprendentes. ¿Qué podrían enseñarnos algún día?

ORIGINAL NOTE: https://www.nytimes.com/es/2024/03/14/espanol/inteligencia-artificial-celular-cancer-biologia.html

Read in English

En 1889, un médico francés llamado Francois-Gilbert Viault bajó de una montaña de los Andes, se extrajo sangre del brazo y la analizó bajo el microscopio. Sus glóbulos rojos, los cuales se encargan de transportar oxígeno, habían aumentado 42 por ciento. Había descubierto que el cuerpo humano tenía un poder misterioso: cuando necesita tener más de estas células fundamentales, puede fabricarlas según las requiera.

A principios del siglo XX, los científicos plantearon la teoría de que la causa de ese fenómeno era una hormona. A esta hormona teórica la llamaron eritropoyetina, que significa “productora de glóbulos rojos” en griego. Siete décadas después, los investigadores descubrieron la verdadera eritropoyetina después de filtrar 2536 litros de orina.

Y cerca de 50 años después de eso, biólogos de Israel anunciaron que habían encontrado una célula renal poco común que fabrica esa hormona cuando el oxígeno desciende demasiado. La nombraron célula Norn en honor a las deidades nórdicas que, según se creía, controlan el destino de la humanidad.

Los seres humanos tardaron 134 años en descubrir las células Norn. El verano pasado, unas computadoras en California las descubrieron en solo seis semanas.

El descubrimiento ocurrió cuando los científicos de la Universidad de Stanford programaron las computadoras para que ellas mismas se enseñaran biología. Estas computadoras ejecutaban un programa de inteligencia artificial parecido al ChatGPT, el popular bot que ha llegado a manejar el lenguaje con fluidez después de haberse entrenado con miles de millones de textos obtenidos de internet. Pero los investigadores de esta universidad entrenaron sus computadoras con datos sin procesar acerca de millones de células reales y su composición química y genética.

Los investigadores no les dijeron a las computadoras lo que significaban estas mediciones; tampoco les explicaron que los diferentes tipos de células tienen distintos perfiles bioquímicos. No definieron, por ejemplo, qué células captan la luz en nuestros ojos, ni cuáles fabrican anticuerpos.

Las computadoras desentrañaron los datos por sí mismas y crearon un modelo de todas las células con base en el parecido de unas con otras en un espacio enorme y multidimensional. Cuando las máquinas terminaron, ya habían aprendido muchísimo. Pudieron clasificar una célula que nunca antes habían visto como una entre 1000 tipos diferentes. Una de ellas fue la célula Norn.

“Eso es muy extraordinario porque nunca nadie le dijo al modelo que las células Norn estaban en el riñón”, comentó Jure Leskovec, un informático de la Universidad de Stanford que entrenó a las computadoras.

Este software es uno de los muchos programas nuevos impulsados por inteligencia artificial que se conocen como modelos fundacionales y que se están centrando en los aspectos fundamentales de la biología. Los modelos no solo están ordenando la información que los biólogos recaban, sino que están realizando descubrimientos sobre cómo funcionan los genes y cómo se desarrollan las células.

A medida que aumenten los modelos, con cada vez más datos de laboratorio y capacidad informática, los científicos prevén que comenzarán a realizar descubrimientos más profundos. Es posible que descubran secretos sobre el cáncer y otras enfermedades y podrían idear recetas para convertir un tipo de célula en otro.

“Creo que en cierto momento veremos algún descubrimiento fundamental sobre la biología que, de otra manera, los biólogos no hubiesen realizado”, señaló Eric Topol, director del Scripps Research Translational Institute.

Qué tan lejos se llegará sigue siendo un tema de debate. Aunque algunas personas escépticas creen que los modelos llegarán a su tope, los científicos más optimistas piensan que los modelos fundacionales abordarán incluso la pregunta más grande de la biología: ¿Qué separa la vida de lo que no es vida?.

Las células cardiacas y las ratas topo

Desde hace mucho tiempo, los biólogos han querido entender la manera en que las diferentes células del cuerpo usan los genes para hacer muchas cosas que necesitamos con el fin de mantenernos vivos.

Hace aproximadamente una década, los investigadores comenzaron a realizar experimentos a escala industrial para buscar fragmentos genéticos procedentes de células individuales. Los científicos registraron lo que hallaron en catálogos o “atlas celulares”, los cuales se llenaron de miles de millones de datos.

Christina Theodoris, una médico residente en el Hospital Infantil de Boston, estaba leyendo acerca de un nuevo tipo de modelo de inteligencia artificial fabricado por los ingenieros de Google en 2017 para traducciones lingüísticas. Los investigadores alimentaron el modelo con millones de oraciones en inglés, junto con sus traducciones al alemán y al francés. El modelo desarrolló la capacidad de traducir oraciones que nunca antes había visto. Theodoris se preguntó si un modelo similar podría aprender a interpretar los datos de los atlas celulares.

En 2021, no podía encontrar un laboratorio que le permitiera tratar de construir uno. “Había mucho escepticismo acerca de que este método funcionara”, comentó.

Shirley Liu, una bióloga computacional en el Instituto para el Cáncer Dana-Farber en Boston, le dio una oportunidad. Theodoris extrajo datos de 106 estudios en seres humanos que habían sido publicados, los que, en su conjunto, incluían 30 millones de células e introdujo todo en un programa llamado GeneFormer.

El modelo alcanzó un conocimiento profundo de la manera en que se comportan nuestros genes en las diferentes células. Por ejemplo, predijo que apagar un gen llamado TEAD4 en un cierto tipo de célula cardiaca la afectaría de manera considerable. Cuando su equipo puso a prueba esta predicción en células reales llamadas cardiomiocitos, la pulsación de las células cardiacas se debilitó.

En otra prueba, Theodoris y sus colegas le mostraron a GeneFormer células del corazón tanto de personas con ritmos cardiacos deficientes como de personas sanas. “Luego le pedimos que nos dijera qué modificaciones hay que hacerles a las células enfermas para poder sanarlas”, explicó Theodoris, quien ahora trabaja en la Universidad de California, campus San Francisco.

GeneFormer recomendó disminuir la actividad de cuatro genes que nunca antes se habían asociado con cardiopatías. El equipo de Theodoris siguió el consejo del modelo y eliminó cada uno de los cuatro genes. En dos de los cuatro casos, el tratamiento mejoró cómo las células se contraían.

El equipo de la Universidad de Stanford entró al negocio de los modelos fundacionales después de ayudar a construir una de las bases de datos de células más grandes del mundo, conocida como CellXGene. Desde el mes de agosto, los investigadores entrenaron a sus computadoras con 33 millones de células de esa base de datos y se concentraron en un tipo de información genética llamada ARN mensajero. También alimentaron el modelo con estructuras tridimensionales de proteínas, que son el producto de los genes.

Las computadoras aprendieron a clasificar más de mil tipos de células basándose en cómo se activan y desactivan sus genes. Este mapa muestra cómo organizaron 36 millones de células en grupos.Credit…Jure Leskovec

A partir de estos datos, el modelo (conocido como integración celular universal, o UCE, por su sigla en inglés), calculó la similitud entre las células y las agrupó en más de 1000 grupos de acuerdo con la manera en que usaban sus genes. Los grupos correspondían a tipos de células descubiertas por varias generaciones de biólogos.

El UCE también se enseñó a sí mismo algunas cosas importantes sobre cómo las células se desarrollan a partir de un solo óvulo fecundado. Por ejemplo, el modelo reconoció que todas las células del cuerpo pueden agruparse dependiendo de cuál de las tres capas salieron en la fase inicial del embrión.

“Prácticamente volvió a descubrir la biología del desarrollo”, señaló Stephen Quake, un biofísico de la Universidad de Stanford que ayudó a desarrollar el UCE.

El modelo también fue capaz de transferir su conocimiento a nuevas especies. Cuando se le proporcionó el perfil genético de las células procedentes de un animal que nunca antes había visto (por ejemplo, una rata topo desnuda), el UCE pudo identificar muchos de sus tipos de células.

“Se puede traer un organismo totalmente nuevo (pollo, rana, pez, o lo que sea), introducirlo y obtener algo útil de eso”, señaló Leskovec.

Después de que el UCE descubrió las células Norn, Leskovec y sus colegas ingresaron a la base de datos CellXGene para ver de dónde habían venido. Aunque muchas de las células habían provenido de los riñones, algunas procedían de los pulmones y de otros órganos. Los investigadores especularon que era posible que células Norn antes desconocidas estuvieran esparcidas por todo el cuerpo.

Katalin Susztak, una médico investigadora en la Universidad de Pensilvania que estudia las células Norn, mencionó que el hallazgo despertó su curiosidad. “Quiero revisar esas células”, dijo.

Susztak no cree que el modelo haya encontrado células Norn verdaderas afuera de los riñones porque no se ha encontrado la hormona eritropoyetina en otros lugares. Pero las nuevas células podían sentir el oxígeno como lo hacen las células Norn.

En otras palabras, es posible que el UCE haya descubierto un nuevo tipo de célula antes que los biólogos.

Un ‘internet de células’

Al igual que ChatGPT, los modelos biológicos también se equivocan. Hace poco, Kasia Kedzierska, una bióloga computacional de la Universidad de Oxford, y sus colegas les dieron a GeneFormer y a otro modelo fundacional, el scGPT, una serie de pruebas. Les presentaron atlas celulares que nunca antes habían visto y los pusieron a ejecutar tareas como clasificar las células en tipos. Los modelos hicieron bien algunas tareas, pero en otros casos tuvieron un mal desempeño en comparación con programas computacionales más simples.

Kedzierska comentó que tenía mucha esperanza en los modelos, pero advirtió que, por el momento, “no deben usarse así como así sin que se tenga un conocimiento adecuado de sus limitaciones”.

Leskovec mencionó que los modelos estaban mejorando a medida que los científicos los entrenaban con más datos. Pero en comparación con el entrenamiento que recibió el ChatGPT con datos de todo el internet, los últimos atlas celulares solo brindan una cantidad reducida de información. “Me gustaría tener todo un internet de células”, dijo.

A medida que atlas celulares más grandes lleguen a internet, habrá más células. Además, los científicos están recolectando diferentes tipos de datos de cada una de las células de esos atlas. Algunos científicos están clasificando las moléculas que se adhieren a las células o tomando fotografías de las células para ilustrar la ubicación precisa de sus proteínas. Toda esa información permitirá que los modelos fundacionales saquen conclusiones acerca de qué hace que las células funcionen.

Los científicos también están desarrollando herramientas que permitan que los modelos fundacionales combinen lo que están aprendiendo por su cuenta con lo que han descubierto los biólogos de carne y hueso. La idea sería relacionar los hallazgos de miles de artículos científicos publicados con las bases de datos de las mediciones de células.

Los científicos afirman que con datos suficientes y capacidad informática es posible que con el tiempo generen una representación matemática completa de la célula.

Quake sospecha que los modelos fundacionales no solo aprenderán sobre los tipos de células que habitan actualmente en nuestro cuerpo, sino también sobre el tipo de células que podrían existir. El experto especula que solo algunas combinaciones bioquímicas pueden mantener una célula viva y sueña con usar los modelos fundacionales para hacer un mapa que muestre el ámbito de lo posible, más allá del cual la vida no puede existir.

“Creo que estos modelos nos ayudarán a llegar a un entendimiento fundamental de la célula, lo que nos dará una cierta idea de lo que es realmente la vida”, aseveró Quake.

Tener un mapa de lo que es posible e imposible para sustentar la vida quizá también signifique que los científicos puedan, de hecho, generar células nuevas que no existen en la naturaleza. El modelo fundacional podría ser capaz de elaborar recetas químicas que transformen las células comunes y corrientes en células nuevas y extraordinarias. Esas nuevas células podrían engullir la placa de los vasos sanguíneos o explorar un órgano enfermo e informarnos sobre su gravedad.

“Es como un gran Viaje fantástico”, reconoció Quake. “Pero quién sabe lo que nos deparará el futuro”.

Esta traducción es una versión abreviada del artículo original en inglés

Léelo completo aquí