Genoma complet: a mig camí de la representativitat

El camp de la genòmica humana ha pogut celebrar una interessantíssima bona nova aquestes últimes setmanes. El 31 de març, la revista Science publicava la versió (més) completa del genoma humà. El consorci Telomere-to-Telomere –els extrems dels cromosomes els anomenem telòmers– presentava l’últim assemblatge genòmic: T2T; el primer genoma que inclou la seqüència del 8% de l’ADN que no havíem estat capaços d’esbrinar –les regions 'obscures'. En aquest cas, com suggereix el nom, els autors han estat capaços de seqüenciar 'de cap a cap' les lletres (sic) que formen l’ADN humà, vint anys després de la publicació de la primera versió del genoma per part del consorci The Human Genome Project

Aquella primera interpretació del genoma –i les següents versions i actualitzacions que han anat emplenant els 'buits' de la seqüència de l’ADN que no havíem completat encara– ens ha servit de referència per facilitar la seqüenciació del genoma individual dels pacients i així expandir el camp de la genètica d’una manera exponencial. Ja tenim molt per mà el fet d’agafar una mostra biològica, extreure’n l’ADN, trossejar-ho, fer-ne moltes còpies i, com si es tractés d'un puzle, realinear les petites seqüències utilitzant el genoma de referència. Tot això de manera computacional, és clar.

Un exemple d’empenta dràstica del coneixement fent servir aquesta praxi és al camp de la biologia del càncer amb el projecte The Cancer Genome Atlas (TCGA). Durant més d’una dècada, el consorci del TCGA ha generat aproximadament 2,5 petabytes de dades per a la caracterització dels tipus de càncer més freqüents, amb més de d’11.000 pacients seqüenciats i 20.000 gens estudiats. 

Per altra banda, les dades genòmiques generades i analitzades per aquests grans consorcis genòmics com el TCGA representen el punt de partida per a la majoria de grups de recerca, el que suposa que qualsevol biaix que aquestes dades puguin presentar repercuteixi de manera directa damunt els resultats obtinguts. Un dels biaixos més clars és la major fracció de pacients caucàsics seqüenciats i la baixa representació d’altres ètnies de la població mundial (asiàtics, africans, hispànics i altres). Aquesta problemàtica no ha passat desapercebuda per la comunitat científica, ja que diferents camps d’aplicació clínica com l’anomenada medicina personalitzada –aquella que utilitza la informació genètica del pacient per a la diagnosi i tractament individualitzat– es podrien veure àmpliament afectats per aquests biaixos. 

Per tal de resoldre aquestes disparitats, els últims anys han sorgit diversos projectes nacionals (com el projecte 3MAG a l’Àfrica o la versió del TCGA al Japó) i internacionals encoratjats en aquesta missió. Un dels més importants i recentment iniciats és The Human Pangenome Project, explicat aquesta setmana a la revista Nature, que tractarà d’augmentar i balancejar la representativitat entre totes les distintes poblacions ètniques de la ciutadania global.

Per tant, ens trobem a mig camí del genoma 'complet', almenys d’aquell que representi de manera igualitària i que beneficiï de la millor manera totes les persones que poblem el planeta. Un genoma per representar-nos a totes.

Sebastià Franch Expósito és científic

stats