Conosciamo ormai tutta la mappatura del nostro DNA, risultato straordinario dell'immenso lavoro di "Progetto Genoma". L'iniziativa è conosciuta anche ai meno "addetti ai lavori", grazie al fatto che il suo più significativo promotore è stato Renato Dulbecco, lo scienziato italiano che per questo è stato insignito del Premio Nobel.

Progetto Genoma raccoglie le versioni "normali" dei nostri geni, cioè quelle statisticamente più diffuse nella popolazione.

La principale ragione per cui si sono investite così tante e pregiate risorse nella comprensione del nostro patrimonio genetico, risiede nel fatto che i geni contengono le istruzioni che le nostre cellule seguono per fabbricare componenti fondamentali per il funzionamento dell'organismo, le proteine. Queste entrano successivamente in tutti i processi biochimici dell'organismo (basti pensare che tutti gli enzimi sono proteine), in tutti i tessuti di tutti i sistemi che lo compongono. Vale a dire che un gene "malato" codifica per una proteina "sbagliata", che non sarà in grado di svolgere le funzioni per cui è stata assemblata. L'effetto domino è totale: a cascata, una singola molecola presente in un singolo frammento di un minuscolo gene, può generare patologie incompatibili con la vita.

Ecco perché è tanto importante avere acquisito la possibilità di conoscere il nostro DNA.

Successivamente al completamento di Progetto Genoma ci si è resi conto che raccogliere informazioni sulle istruzioni che la nostra impalcatura cellulare utilizza per sintetizzare le proteine non è sufficiente a chiarire tutti i dubbi. Proprio per l'ubiquità che caratterizza le proteine nei processi biochimici, è altrettanto necessario conoscere quali di queste sono associate a quali porzioni genomiche codificanti, partendo dal presupposto dogmatico della biologia, secondo il quale ad ogni gene è connessa una ed una sola proteina.

Così si è dato inizio ad un secondo, colossale lavoro: Progetto Proteoma. La costituzione di un ulteriore, immenso archivio di tutte le proteine che entrano a fare parte dei sistemi biologici umani.

E fin qui continuiamo ad occuparci di "normalità", di diffusione statistica, di versioni presenti nella maggiorparte delle persone. Ma il libro della vita è scritto secondo caratteri un pochino più complessi: del principio "by the book" non sono previste che poche, vere applicazioni in biologia.

Cosa succede quando un gene è diverso dalla forma in cui figura nella grande Bibbia della biologia che è Progetto Genoma?

Essenzialmente, che dà origine a tre possibili conseguenze.

La prima è che sia così anomalo da generare una proteina sbagliata. E qui siamo nel campo della patologia. La terapia genica di cui abbiamo raccontato in più occasioni qui a WELLNESS4GOOD serve proprio a ripristinare la versione corretta del gene, in maniera che questo produca la proteina funzionante.

La seconda è che il gene sia diverso dal normale ma comunque in grado di codificare per la proteina corretta. E qui si aprono due ulteriori ipotesi. Nel primo caso la versione è significativamente diffusa nella popolazione (più dell'1%) e allora si determina il cosiddetto "polimorfismo" genetico. Nel secondo è meno distribuita: allora è semplicemente una variante.

Conoscere le varianti è fondamentale per comprendere i processi alla base di un numero elevatissimo di malattie. Non solo, ma anche per capire meglio come certi fenomeni biologici avvengano, per uscire dalla logica ordinata delle classificazioni stereotipiche.

Il database ExAC, completato nel 2014, risponde a questa esigenza.

Esso annovera tutte le variazioni dei geni codificanti per proteine ed è stato costituito analizzando i dati provenienti dall'analisi genomica di più di 60.000 persone.

I dati raccolti in questo enorme archivio biologico ci permettono di conoscere quali sono le varianti dei geni così come sono presenti nella popolazione. ExAC è uno specchio della realtà biologica, che si discosta dalla preordinata rigidità dei paradigmi accademici. E' la prova che il disordine dei processi biochimici è la forma di arricchimento resa possibile dall'eterogeneità della biologia.

Tuttavia, le disquisizioni filosofico-scientifiche non devono adombrare l'eccezionalità delle applicazioni più strettamente pragmatiche di ExAC. Per esempio nel determinare i falsi positivi, ossia persone nelle quali il gene è presente variato ma non in maniera tale da essere associato ad una patologia. O, ancora, nel costituire una risorsa chiave per l'implementazione della medicina di precisione, cioè la possibilità di studiare terapie personalizzate per ogni singolo paziente.

Da un punto di vista più in generale, questa incredibile raccolta di dati ci consente di studiare in maniera più completa la biologia umana, per indagarne i segreti che ancora ci tengono lontani dalla comprensione dei meccanismi più interessanti alla base dei fenomeni con cui la vita si manifesta.