El mes d’abril passat la policia californiana va arrestar l’anomenat Golden State Killer, un assassí i violador en sèrie que va sembrar el terror en aquest estat als anys 70 i 80. Els investigadors han localitzat el sospitós combinant mostres d’ADN trobades a les escenes del crim i webs de genealogia genètica accessibles al públic, sobretot GEDMatch.

Aquest fet, que de per si ja fa reflexionar, ha generat un gran enrenou i ha suscitat un debat sobre la privacitat genètica, la propietat de les dades genètiques, l’ús correcte de les mostres d’ADN i les recerques de la policia a les bases de dades. Com a investigadora que estudia l’accés a dades genètiques brutes o sense interpretar i l’ús que en fa la gent a les webs que interpreten aquestes dades -com ara GEDMatch-, m’alegro que l’opinió pública pari atenció a una sèrie de matisos fonamentals en el món de les proves genètiques personals.

Hi ha diferències notables -sovint infravalorades- entre les empreses que fan proves directes per als consumidors, que són més conegudes, i les webs independents que prometen als usuaris una interpretació més detallada de les seves dades genètiques. Les proves genètiques directes encarregades pel consumidor són relativament habituals des del 2007. Les dues principals empreses que s’hi dediquen, 23andMe i AncestryDNA, han reunit entre totes dues més de 10 milions de clients. Per uns 100 dòlars, aquestes empreses et demanen que escupis saliva en un tub, de la qual t’extreuen l’ADN. Analitzen una mostra predefinida d’entre mig milió i un milió d’allò que els genetistes en diuen parells de bases -els enllaços d’A, C, T i G- del teu genoma. Aquest subconjunt representa menys del 0,05% de tot el genoma; poques empreses s’ofereixen a seqüenciar-lo tot.

L’ús de les dades genètiques

Depenent de l’empresa, aquesta informació genètica serveix per elaborar informes sobre genealogia, trets físics, predisposició a malalties o parentius amb altres clients de la seva base de dades. La majoria d’aquestes empreses també permeten als clients descarregar un arxiu de les seves dades genètiques brutes o sense interpretar. Bàsicament és un llarg arxiu de text que enumera tots els marcadors genètics genotipificats per l’empresa i la seqüència d’ADN del client. Així doncs, ara els clients d’aquestes empreses tenen al disc dur del seu ordinador fitxers de dades brutes sobre les quals potser voldrien tenir més informació, tot i que no saben ben bé com. El que poden fer és introduir les dades en webs independents dirigides per altres companyies, empresaris i científics. Aquestes eines en línia permeten als usuaris aprofundir en la interpretació i l’anàlisi dels seus fitxers de dades brutes, amb la qual cosa potser també contribueixen a una recerca posterior. Actualment hi ha desenes d’eines d’aquesta mena i sembla que la llista creix.

Si la genòmica del consumidor de la dècada passada hagués sigut un festival de música, les grans companyies n’haurien sigut les protagonistes a l’escenari principal, mentre que les eines independents haurien actuat en espais més petits. Potser aquestes últimes tenen seguidors lleials i fidels, però no són tan conegudes entre el públic en general com les empreses que fan les proves directes. A més, aquestes eines independents s’han investigat poc en comparació amb l’atenció acadèmica dedicada a les proves directes encarregades pel consumidor. D’altra banda, aquest conjunt d’aplicacions i webs independents també és molt dispar. Si bé podem classificar-les segons les categories d’informació que ofereixen les empreses que fan proves directes -salut, ascendència genealògica i parents-, són més variades pel que fa a dimensions, tipus de funcionament i altres funcions, com per exemple la possibilitat que estiguin lligades a iniciatives de recerca científica ciutadana.

Mostra de saliva o dades genètiques

Una de les principals diferències entre les empreses que fan proves directes i les webs i bases de dades independents és allò que els enviem i com. La majoria d’empreses que fan proves directes reben les mostres d’ADN mitjançant uns kits per recollir mostres de saliva que s’envien per correu. Produir un mil·lilitre o dos de saliva és sorprenentment difícil: sens dubte, no és una cosa que fas com si res. De fet, les empreses van optar en part per aquest mètode de recollida de mostres per impedir les proves subreptícies: és poc probable que algú pugui enviar-ne una mostra sense que el propietari se n’assabenti.

La saliva és el material físic a partir del qual les empreses treuen molècules d’ADN per determinar-ne el genotip i generar un arxiu amb les dades genètiques brutes del client. Un cop recopilades en un arxiu, les dades genètiques són força fàcils de transferir i més difícils de controlar. Es poden enviar per correu electrònic, es poden introduir o copiar en memòries USB o enviar-les als 10 millors amics. A diferència del que passa quan escups una mostra de saliva en un tub, pot passar que no t’assabentis que algú obté i penja en una web el fitxer de les teves dades.

En realitat, el que aquestes webs interpretatives fan amb els fitxers de dades genètiques varia molt, i això és especialment important en el cas de l’assassí del Golden State. Algunes eines -com ara Promethease- esborren les dades de l’usuari després d’un breu període de temps fixat prèviament. La web les reté prou temps per generar un informe de salut. En el cas d’altres eines, no cal que les dades surtin de l’ordinador o dispositiu de l’usuari perquè l’anàlisi es fa localment; és el cas, per exemple, de GENOtation/Interpretome, les utilitats de David Pike i l’aplicació de smartphone DNA Doctor.

En canvi, per a altres eines conservar molt de temps les dades dels usuaris és fonamental per al seu funcionament i missió. Les webs especialitzades en genealogia, com ara GEDMatch, han de guardar la informació perquè els nous usuaris puguin buscar els seus familiars a la base de dades, com fan també les empreses de proves directes que ofereixen un servei per localitzar parents. Eines com DNA.Land retenen les dades de l’usuari per dur a terme estudis de recerca. De tota manera, aquestes webs que es queden la informació no són bases de dades obertes al públic; no es poden descarregar dades genètiques brutes d’altres usuaris ni tampoc s’hi pot accedir directament. Una notable excepció és el projecte de ciència oberta openSNP, que explícitament permet descarregar amb tota llibertat les dades de tots els usuaris amb l’objectiu d’aconseguir que la ciència sigui més accessible i col·laborativa.

La propietat informacional

Una altra característica força sorprenent de les dades genètiques és que, un cop s’han extret d’una mostra física, es poden utilitzar en molts llocs alhora. L’empresa 23andMe pot tenir les meves dades genètiques i fer-les servir per a la recerca. Jo també les puc tenir i fer-les servir en totes les webs que vulgui. Des del punt de vista jurídic, les dades genètiques poden tenir la mateixa consideració que qualsevol altra propietat informacional o intel·lectual: el seu consum està obert a tothom, és a dir, el fet que les utilitzi una persona no n’impedeix l’ús a mans d’altres.

Aquestes característiques diferencien les dades genètiques de la propietat física, la qual normalment no poden utilitzar moltes persones alhora i pot prescriure amb el temps. S’acostuma a passar per alt que el conjunt de drets de propietat aplicables a una mostra física d’ADN -una simple mostra de saliva o les molècules d’ADN que se n’han extret- són diferents de les d’un fitxer de dades genètiques. Segons els antecedents jurídics de què disposem, les persones no tenen drets de propietat sobre els seus biospècimens. De tota manera, fins ara no s’ha començat a debatre als tribunals la propietat de les dades genètiques personals.

Independentment de les qüestions relacionades amb la propietat, és difícil controlar l’ús de les dades genètiques en les proves directes encarregades pel consumidor i en les webs i aplicacions independents. El Golden State Killer, Joseph DeAngelo, no va enviar la seva mostra a cap empresa d’aquestes ni va carregar les seves dades a cap web o base de dades d’internet. El que va passar va ser que la policia va utilitzar material abandonat per generar un fitxer de dades genètiques amb el mateix format que els que descarregues d’una empresa de proves directes. Però es veu que alguns familiars seus més llunyans sí que es van fer proves d’aquesta mena. DeAngelo no va penjar les seves dades genètiques a GEDMatch -els investigadors sí que ho van fer- però alguns dels seus familiars hi havien pujat les seves i, gràcies a això, la policia en va anar seguint el rastre fins a localitzar-lo.

Saltar sense mirar abans

¿Quina informació genètica i personal fan pública els que la carreguen a webs independents? No n’hi ha una única resposta perquè aquestes eines presenten diferències notables pel que fa al que ofereixen i el que fan darrere de la pantalla amb les dades.

En resum, les webs d’interpretació de dades constitueixen un grup heterogeni. La majoria no tenen els grans equips jurídics ni els sistemes de gestió tècnica de les grans empreses de proves directes. I actualment no hi ha un marc regulador clar per a les eines independents. En efecte, molts desenvolupadors creuen que les seves activitats es limiten a connectar els usuaris amb fonts preexistents d’anotacions genètiques i, per tant, no és justificada una supervisió més estricta del govern. La falta d’una regulació clara deixa en mans dels ciutadans una bona part de la responsabilitat de fer les comprovacions necessàries abans de recórrer a aquestes eines i serveis. Com a societat estem aprenent a partir dels errors. Quan no paguem (gaire) per un servei, nosaltres i les nostres dades som el producte.