Creen una IA per preveure els efectes de les variacions de l'ADN en la salut humana
El nou model de Google DeepMind permetrà identificar l’origen de malalties genètiques i desenvolupar nous tractaments
Els tumors poden tenir milers de mutacions, però només algunes són significatives i causen la malaltia. Entendre quines són les que activen el càncer és crucial per poder dirigir-hi tractaments precisos i efectius. I, tanmateix, és un repte important i sovint irresoluble en biologia. Això ara podria començar a canviar gràcies a una IA que ha desenvolupat el laboratori Google DeepMind i permetrà comprendre millor el genoma i interpretar més eficientment i ràpidament les diferències en les seqüències d’ADN.
Han desenvolupat un model d’aprenentatge profund, que han anomenat AlphaGenome, que és capaç de predir amb precisió la funció de seqüències d’ADN de fins a un milió de lletres o parells de bases i com les variacions en aquestes seqüències afecten les cèl·lules, els teixits i la salut humana. Els investigadors, que publiquen el model a Nature, consideren que pot ser una eina molt útil per a la comunitat científica per avançar en el coneixement de la funció del genoma humà, de malalties genètiques, i que obrirà la porta a desenvolupar nous tractaments.
“És un gran exemple de com la IA està accelerant el descobriment biològic i el desenvolupament de noves teràpies”, considera Ben Lehner, investigador ICREA al Centre de Regulació Genòmica (CRG). En declaracions al Science Media Center, aquest biòleg valora que “identificar les diferències exactes entre els genomes que ens fan més o menys vulnerables a desenvolupar milers de malalties és un gran avenç de cara a poder desenvolupar millors tractaments”.
La part fosca del genoma
El 2003, i després de més d’una dècada d’esforços, una coalició internacional de científics va publicar la primera seqüència del genoma humà, el conjunt complet d’ADN que estableix com és i com funciona un organisme viu, des de l’aparença que té fins a la reproducció o quines tasques fan cada una de les cèl·lules que el componen. Tanmateix, tot i que aquell ambiciós projecte va aconseguir per primera vegada tenir el “llibre de la vida”, llegir-lo i comprendre’l era un desafiament, perquè la gramàtica no s’entenia.
Aquests anys s’ha anat descobrint, per exemple, que només un 2% de tot el genoma codifica per a proteïnes, que són les “obreres” encarregades de dur a terme les tasques cel·lulars. El 98% restant és no codificant, una part fosca i desconeguda que conté moltes seqüències repetitives, elements mòbils i seqüències d’ADN reguladores que, com explica l’investigador del Centre Nacional de Biotecnologia (CNB-CSIC) Lluís Montoliu al Science Media Center Spain, s’encarreguen de dir als gens quan i com han de començar a funcionar o quan i on han d’apagar-se. És com si fossin un panell de control que contribueix a fer que es produeixin les proteïnes. I és en aquestes regions fosques on hi ha moltes variacions o mutacions associades a malalties. Per això, durant anys s’han desenvolupat algoritmes i programes per intentar entendre quines seqüències eren reguladores.
“Ara DeepMind ens torna a deixar amb la boca oberta amb AlphaGenome i la seva capacitat d’interpretar i predir aquelles seqüències del genoma sense sentit, del no codificant”, apunta Montoliu, per a qui aquesta nova IA tindrà “un impacte significatiu en recerca bàsica, per entendre com funcionen els gens, i també en aspectes més pràctics i aplicats”. El model, assegura Natasha Latysheva, enginyera de DeepMind, impulsarà la biologia fonamental, accelerarà la nostra comprensió del genoma i ens ajudarà a localitzar on són els elements funcionals i quines funcions tenen.
Per entrenar AlphaGenome els investigadors van fer servir el coneixement generat per iniciatives públiques internacionals com ENCODE o GTEx, que han generat una enorme quantitat de dades sobre regulació gènica en diferents teixits i condicions, i van utilitzar genomes de ratolins i d'humans. Un dels punts forts del model és que és capaç de fer múltiples prediccions sobre un nombre important de senyals genètics associats a funcions específiques de forma simultània.
Un premi Nobel
Fa uns anys aquest mateix laboratori va desenvolupar AlphaFold, una IA que permetia predir l’estructura 3D de les proteïnes a partir només de la seqüència d’ADN, avenç que va ser reconegut amb el premi Nobel el 2024. A AlphaFold ara DeepMind suma AlphaGenome, que va llançar fa 6 mesos en obert per tal que la comunitat científica el pogués començar a utilitzar per fer recerca. En aquest temps, l’han fet servir tres mil científics de 160 països, que han generat al voltant d’un milió de peticions per dia per avançar en àrees tan diverses com malalties neurodegeneratives, infeccioses o càncer.
Tot i que el model permet predir resultats moleculars, destaquen els científics de DeepMind, no ofereix tota la pel·lícula de com les variacions genètiques porten a malalties o a trets complexos, perquè també hi ha implicats altres factors, com els ambientals.