La molécule d'ADN, longue chaine de nucléotides, est le support de l'hérédité. Chez l'Homme, le génome est composé d'environ 3,3 milliards de paires de bases réparties en 46 chromosomes. Mais seul un faible pourcentage de cette longue séquence de nucléotides a pour fonction établie de diriger la synthèse des protéines, via une étape de transcription en ARN messager puis de traduction de cet ARN messager en chaine d'acide aminés. En effet, grâce au projet génome humain, on sait que l'ADN codant des près de 21 000 gènes humains représente environ 2 à 3 % seulement de l'ADN total. Si certaines fonction des séquences non-codantes sont connues depuis longtemps, notamment dans la régulations de l'expression des gènes, le rôle éventuel de la majorité du génome restait une grande inconnue.

Le projet ENCODE (Encyclopedia of DNA Elements) auquel ont participé 442 chercheurs, c'est attaché à rassembler et synthétiser les résultats de 1640 études portant sur 147 types cellulaires concernant les fonctions de l'ADN, y compris non-codant. Et les résultats sont spéctaculaire puisque ce projet permi d'identifier un activité dans au moins un type cellulaire pour 80 % de l'ADN humain (voir référence). En plus des parties codantes, ont été identifiées plus de 4 millions de séquences régulatrices, 8 800 séquences codant pour des petits ARN, 9 600 pour des longues molécules d'ARN non codant, et 11224 pseudogènes. Par ailleurs, il apparait que les gènes peuvent êtres physiquement recouvrants, avec de nombreux points de début et de fin.

La synthèse de cette somme de résultats laisse apparaitre une complexité, mais aussi une finesse de régulation de l'information génétique qui dépasse largement ce qui est actuellement connu. Or c'est cette régulation qui est à la base de la différence qui existe entre les types cellulaires. Résultat considérable sur le plan fondamental, il ouvre également des perspectives pour mieux comprendre certaines maladies, et peut-être à terme les traiter.

Référence :