PTYANSVS6NDMXKPU56B5F6ENNU.jpg

Las secuencias de ADN de humanos y chimpancés son idénticas en aproximadamente un 98%, pero nadie diría que son animales casi idénticos. Esto se debe a que pequeñas diferencias en las regiones reguladoras (a veces sólo una letra de los 3 mil millones de letras del genoma humano) pueden afectar desproporcionadamente cuándo, dónde y cuántos genes se expresan, creando rasgos específicos de cada especie o conduciendo al desarrollo de cáncer o problemas neurológicos.

La secuenciación del genoma humano se completó en 2003, y siguen surgiendo noticias sobre genes de la felicidad, genes de la homosexualidad o que provocan alguna enfermedad. O nos sugieren que sólo una pequeña minoría de humanos distingue a los humanos de otros animales. Se ha dicho en el pasado que los genes contienen instrucciones para que las células produzcan proteínas y reconstruyan el tejido de la piel, por ejemplo, y que cuando este proceso sale mal, por ejemplo, pueden surgir problemas. Pero a pesar de toda la retórica, se sabe que la biología no es un proceso tan simple.

Además de la porción de ADN que contiene la información para producir los componentes básicos de nuestros cuerpos (es decir, proteínas), hay una gran porción del genoma, incorrectamente llamada ADN basura, que no codifica proteínas pero afecta la forma en que se producen las proteínas en las porciones del genoma que están codificadas.

Más del 98% de nuestras variantes genéticas son así, cambiando el comportamiento del genoma a través de múltiples mecanismos, y una misma variante puede tener diferentes efectos en las células cerebrales o musculares. Comprender la complejidad de estos efectos sería imposible sin computadoras, y los expertos en computación han proporcionado herramientas para darle sentido a este caos aparentemente interminable.

El miércoles, Google DeepMind presentó en un artículo publicado en la revista naturalezasu modelo AlphaGenome, pretende explicar el genoma humano, concretamente las regiones no codificantes del ADN. “El Proyecto Genoma Humano nos ha dado el libro de la vida, pero leerlo sigue siendo un desafío. Tenemos el texto, pero todavía estamos descifrando la semántica”, dijo Pushmeet Kohli, vicepresidente de ciencia de Google Deepmind, quien dirigió el esfuerzo, mientras presentaba los resultados.

El ADN es una sopa de letras y los efectos pueden ser enormes. Por ejemplo, se cree que la pérdida de pequeños fragmentos de proteína producidos por una fórmula química de 24 letras (GCAAGGACATATGGGCGAAGGAGA) puede alterar el desarrollo del cerebro y promover el autismo. En pocas palabras, AlphaGenome actúa como un intérprete universal de la sopa de letras del ADN. Se obtiene un trozo de ADN, de un millón de letras, y se predice su función letra por letra.

Entre otras cosas, puede predecir cuántos genes se expresan, cómo está organizado el ADN en tres dimensiones (lo que también es relevante para sus efectos) o cómo se organizan los genes en tres dimensiones. empalmeun sistema de empalme que une secuencias de letras y permite que el mismo gen produzca diferentes lecturas, está detrás de la capacidad de las células de producir diferentes proteínas con diferentes funciones o de existir en tantos organismos diferentes. Sin el poder de la inteligencia artificial, explicar todo a escala sería casi imposible.

Los modelos anteriores podían predecir uno de estos fenómenos, pero no todos simultáneamente, lo que nos enfrentaba a un dilema. Los sistemas que proporcionan análisis letra por letra sólo pueden analizar secuencias cortas de aproximadamente 10.000 pares de letras. Esto significa, por ejemplo, que no pueden ver los efectos de regiones reguladoras distantes que actúan como interruptores genéticos que alejan cientos de miles de letras de los genes que controlan. Por otro lado, los modelos que pueden manejar cientos de miles de bases no tienen la resolución necesaria para ver los efectos de letras individuales. Es como elegir entre mirar a través de un telescopio o una lupa, pero con AlphaGenome no es necesario.

El artículo también demuestra su capacidad para comprender la enfermedad. La leucemia linfocítica T es un ejemplo. En este caso, el gen TAL1 no muta, pero se activa brutalmente y provoca cáncer. Analizar letras mutadas individuales en regiones parciales. genoma basuraAlejándose de los genes, pudieron predecir cómo las mutaciones activarían los genes tumorales. Esta tarea requirió meses de experimentación en el laboratorio, pero AlphaGenome pudo simularla y resolverla en poco tiempo, demostrando su capacidad para revelar mecanismos patológicos ocultos.

Mafalda Dias, investigadora del Centro de Regulación Genómica de Barcelona y una de las creadoras del modelo de IA popEVE, cree que la capacidad combinada de especificar y procesar un gran número de bases hace de AlphaGenome “un paso adelante muy interesante como continuación de lo que la comunidad científica viene haciendo desde hace algún tiempo”. Sin embargo, advierte, “estos modelos no tienen muchas capacidades de personalización”. “Estos modelos son útiles para comprender lo que sucede en biología regulatoria, pero no son útiles para predecir si la variación entre diferentes personas tendrá un efecto; tienen una utilidad clínica limitada”, añadió Dias, que no participó en este trabajo.

Estos modelos predicen de manera abstracta los efectos moleculares de las variantes, pero no pueden predecir la expresión genética específica en individuos específicos. Esto depende de todo su genoma y contexto ambiental, lo que está más allá del alcance del modelo. Hoy en día su uso es más para investigación básica que para diagnóstico directo.

Žiga Avsec, responsable del diseño del modelo, reconoció que aún no han resuelto “el problema de predecir el impacto de las variantes”. “Creo que todavía nos queda un largo camino por recorrer”, afirmó. Aunque el modelo puede predecir cómo la variación genética afecta a procesos moleculares como la expresión genética, no puede predecir de forma fiable y completa las consecuencias que los cambios en las letras del ADN pueden tener en la realidad, en las células o tejidos y en la salud de una persona.

Aunque el modelo “no es perfecto porque la expresión genética se ve afectada por factores ambientales complejos que el modelo no puede detectar, el nivel de precisión demostrado se logra basándose únicamente en las reglas”. premisa “Se trata de una hazaña técnica increíble”, dijo al portal Science Media Center Robert Goldstone, director de genómica del Instituto Francis Crick de Londres. Algunos investigadores ya ven el potencial de estos modelos en aspectos como el diagnóstico de enfermedades raras, y ya no deberían limitarse a buscar riesgos en genes específicos.

Natasha Latysheva, coautora del estudio, explica que por ahora sus creadores consideran AlphaGenome una herramienta para la ciencia básica: “Vemos a AlphaGenome como una herramienta para comprender el papel de los elementos funcionales del genoma, que esperamos acelere nuestra comprensión fundamental del código de la vida”. El modelo está disponible para uso no comercial por parte de investigadores.

Referencia

About The Author