Por primera vez — y probablemente no la última — avances científicos posibilitados por la inteligencia artificial (IA) han sido reconocidos con un premio Nobel. El Nobel de Química 2024 fue otorgado a John Jumper y Demis Hassabis de Google DeepMind en Londres, por desarrollar una herramienta revolucionaria de IA para predecir estructuras de proteínas llamada AlphaFold, y a David Baker, de la Universidad de Washington en Seattle, por su trabajo en el diseño computacional de proteínas, que ha sido fortalecido por la IA en los últimos años.
“Espero que cuando miremos atrás a AlphaFold, sea la primera prueba del increíble potencial de la IA para acelerar el descubrimiento científico”, dijo Hassabis en una conferencia de prensa en DeepMind el 9 de octubre. “Es tan irreal en este momento”.
El impacto de AlphaFold, que se presentó hace solo unos años, ha sido absolutamente transformador. La herramienta ha hecho que las estructuras de proteínas —a menudo, aunque no siempre, altamente precisas— estén disponibles para los investigadores con solo tocar un botón, y ha permitido experimentos que eran inimaginables hace una década. “Es una gran revolución”, dice Christine Orengo, bióloga computacional en University College de Londres, cuyo laboratorio ha utilizado las estructuras predichas por AlphaFold para descubrir nuevas proteínas.
“Durante mucho tiempo fue un sueño aprender a predecir la estructura tridimensional de las proteínas a partir de sus secuencias de aminoácidos… durante varias décadas, esto se consideraba imposible”, dijo Heiner Linke, presidente del comité Nobel, quien investiga la nanociencia en la Universidad de Lund, Suecia, durante el anuncio del premio. Los laureados de este año “han descifrado el código”, añadió. Los tres ganadores comparten un premio de 11 millones de coronas suecas (un millón de dólares estadounidenses).
IA galardonada
DeepMind presentó AlphaFold en 2018, cuando ganó un concurso bienal de predicción de estructuras de proteínas llamado Evaluación Crítica de la Predicción de Estructuras de Proteínas (CASP). Pero fue la segunda iteración de la red neuronal de aprendizaje profundo, revelada a fines de 2020, la que realmente sacudió las ciencias de la vida. Muchas de las predicciones de AlphaFold2 en CASP fueron tan precisas que eran indistinguibles de las estructuras de proteínas resueltas experimentalmente.
Hassabis, cofundador y director ejecutivo de DeepMind, y Jumper, jefe del equipo de AlphaFold, lideraron el desarrollo de AlphaFold2. Para predecir las estructuras de las proteínas, la red neuronal incorpora datos de bibliotecas de cientos de miles de estructuras y millones de secuencias de proteínas relacionadas, que contienen información sobre sus formas.
En particular, el éxito de AlphaFold se debe en gran medida al Protein Data Bank, un repositorio disponible gratuitamente con más de 200,000 estructuras de proteínas determinadas mediante métodos como la cristalografía de rayos X y la microscopía crioelectrónica. “Es abrumador cada vez que entrenamos [AlphaFold] con años de esfuerzo. Cada punto de datos es el esfuerzo de años de alguien”, dijo Jumper en la conferencia de prensa de DeepMind.
En 2021, DeepMind hizo que el código subyacente de AlphaFold2 estuviera disponible de forma gratuita, junto con los datos necesarios para entrenar el modelo. Una base de datos de AlphaFold, creada con el Instituto Europeo de Bioinformática del Laboratorio Europeo de Biología Molecular en Hinxton, Reino Unido, ahora contiene las estructuras de casi todas las proteínas de cada organismo representado en las bases de datos genéticas, con un total de unas 214 millones de predicciones. Este año, la compañía presentó una tercera versión de AlphaFold, que puede modelar otras moléculas que interactúan con proteínas, como los medicamentos.
La revolución que Jumper, Hassabis y sus colegas desataron aún está en sus primeras etapas, y el impacto completo de AlphaFold en la ciencia podría no conocerse durante años. Ya la herramienta está ayudando a los científicos a hacer nuevos descubrimientos.
Un equipo pionero utilizó la herramienta, junto con datos experimentales, para mapear el complejo del poro nuclear, una de las máquinas más grandes de nuestras células que transporta moléculas hacia dentro y fuera del núcleo. El año pasado, dos equipos examinaron toda la base de datos de AlphaFold para explorar los rincones más oscuros del universo proteico, identificando nuevas familias de proteínas y pliegues, y sorprendentes conexiones en la maquinaria de la vida.
Muchos investigadores esperan que AlphaFold y otras herramientas de IA que ha inspirado transformen la medicina, pero aún no está claro cómo, o si AlphaFold acelerará el costoso y complejo proceso de desarrollar medicamentos seguros. Los científicos que están sentando las bases para nuevas vacunas encuentran que AlphaFold es increíblemente útil y, en algunos casos, revolucionario. Pero AlphaFold es un complemento de los estudios experimentales y otros enfoques para mapear y ajustar la estructura de las proteínas virales para su uso en vacunas.
Para la mayoría de los investigadores, una estructura predicha es el comienzo de un estudio, no el final, dice Jan Kosinski, un modelador estructural en el Laboratorio Europeo de Biología Molecular (EMBL) en Hamburgo, Alemania. “Al principio, existía el temor de que reemplazaría la biología estructural, que la gente perdería sus empleos, y así sucesivamente. En realidad, ha sucedido todo lo contrario”, añade.
David Jones, bioinformático en University College de Londres que colaboró con DeepMind en la primera versión de AlphaFold a partir de 2016, dice que uno de los mayores impactos de la herramienta ha sido un cambio en la mentalidad de los biólogos, “al decir que las computadoras son cosas que pueden producir hipótesis útiles que se pueden probar en el laboratorio”.
Creación de nuevas proteínas
Más de dos décadas antes de que DeepMind comenzara a trabajar en AlphaFold, el biofísico computacional David Baker y sus colegas desarrollaron una herramienta de software llamada Rosetta que modelaba estructuras de proteínas utilizando principios físicos. La herramienta compara pequeños fragmentos de múltiples estructuras y secuencias de proteínas existentes para identificar una secuencia de proteínas que pueda plegarse en una forma particular.
Inicialmente, Rosetta se aplicó para predecir estructuras de proteínas —ha estado entre las mejores entradas en numerosos CASP, antes del dominio de AlphaFold—. Pero Baker pronto se dio cuenta de que el modelo podía invertirse para diseñar proteínas completamente nuevas.
La herramienta tuvo éxito temprano al diseñar proteínas novedosas, incluidos nuevos tipos de enzimas, proteínas que pueden unirse fuertemente a otras moléculas y nanopartículas proteicas autoensambladas que se asemejan a virus (una de estas sirvió como base para una vacuna aprobada contra el COVID-19).
Cuando se anunció AlphaFold2 —pero aún no se había lanzado—, Baker y su equipo, incluido el químico computacional Minkyung Baek, ahora en la Universidad Nacional de Seúl en Corea del Sur, se propusieron comprender el software y aplicar algunas de sus técnicas a una versión previa basada en IA de Rosetta. La primera versión de la red resultante RoseTTAFold rindió casi tan bien como AlphaFold2. Desde 2021, ambas redes han sido mejoradas continuamente por sus desarrolladores y otros científicos para enfrentar nuevos desafíos, como predecir la estructura de complejos de múltiples proteínas que interactúan entre sí.
En los últimos años, el equipo de Baker ha sido especialmente prolífico en aplicar el aprendizaje automático al objetivo principal de su laboratorio: crear proteínas nuevas que nunca antes se habían visto en la naturaleza. Una herramienta desarrollada recientemente por el equipo de Baker que combina RoseTTAFold con redes neuronales de difusión generadoras de imágenes ha dado lugar a un gran avance en la capacidad de los investigadores para diseñar proteínas.
Progreso rápido
Estas herramientas han sido un acelerador masivo y un democratizador, dice Sergey Ovchinnikov, un biólogo evolutivo del Instituto de Tecnología de Massachusetts (MIT) en Cambridge, quien hizo su doctorado en el laboratorio de Baker. Antes, le tomaba a Rosetta semanas de funcionamiento en cientos de procesadores para llegar a un diseño de proteínas, una tarea que las herramientas basadas en IA más recientes pueden realizar en segundos. “Ahora todo el mundo en el mundo puede hacer diseño de proteínas”, dice.
“He estado profundamente inspirado por otros en el campo y por las personas con las que he trabajado”, dijo Baker, hablando por teléfono en el anuncio del premio Nobel. “Me he apoyado en los hombros de gigantes”.
Martin Steinegger, un biólogo computacional en la Universidad Nacional de Seúl en Corea del Sur, compara el impacto de AlphaFold, RoseTTAFold y otras herramientas biológicas de IA con el de las misiones Apolo a la Luna, mostrando lo que la ingeniería puede lograr. “Este es un momento similar para la predicción de estructuras y el campo de la biología estructural —simplemente viendo lo que es posible”, dice.
Pocos se sorprendieron con la decisión del comité Nobel. Para Baker, “la mayoría de la gente pensaba que era una cuestión de ’cuándo, no de si’, con la cantidad de trabajo que ha hecho en ese campo”, dice Jones. Jumper, consciente de que él y Hassabis estaban en muchas listas de candidatos, dijo en la conferencia de prensa que no pudo dormir la noche anterior al anuncio de hoy.
Para Jumper, las estructuras predichas que AlphaFold entrega crean nuevas oportunidades para el descubrimiento científico. Millones de científicos ya han utilizado las herramientas, y espera que no pase mucho tiempo antes de que uno de ellos reciba una llamada desde Suecia. “El momento que será casi tan emocionante como este será cuando el Premio Nobel hable sobre el trabajo realizado con AlphaFold”, dijo.