Les études d’association pangénomique consistent à séquencer l’intégralité du génome de plusieurs individus, sains ou malades. Ici, pour simplifier, seuls dix individus de chaque type sont représentés. On compare ensuite les millions de SNP de ces individus. Dans l’exemple présenté ici, seuls quatre SNP sont représentés. Le SNP1 et le SNP2 sont aussi fréquents dans la population saine que dans la population malade. Cela signifie que le gène responsable de la maladie n’est pas situé à proximité de ces SNP. Ils ne présentent donc pas d’intérêt clinique. Pour ces deux SNP, les individus portant au moins un exemplaire de l’allèle le moins fréquent sont représentés de couleur claire, tandis que les homozygotes pour l’allèle le plus fréquent sont en couleur foncée.

Pour le SNP3, la fréquence de l’allèle T est plus importante chez les individus malades que chez les sains. Le gène à l’origine de la maladie est donc proche du SNP3. Les individus portant au moins un exemplaire de l’allèle T sont représentés de couleur claire, les autres de couleur foncée.

Enfin, l’allèle C du SNP 4 est plus présent chez les individus sains que chez les malades. Cela peut signifier que cette version du SNP est liée à un allèle d’un gène qui a un effet protecteur vis-à-vis de la maladie. Les individus portant au moins un exemplaire de l’allèle C sont représentés de couleur claire, les autres de couleur foncée.

Pour le SNP3, on remarque que la plupart des individus malades possèdent l’allèle T (individus en rouge clair) mais pas tous (individus en rouge foncé). De même, pour le SNP4, l’un des individus sains ne possède pas l’allèle C (individu en vert foncé). Cela signifie que la maladie étudiée ici n’est pas monogénique à pénétrance complète. Il s’agit au contraire d’une maladie multifactorielle, avec au moins un gène, à pénétrance incomplète, ayant un effet délétère, et un gène ayant un effet protecteur.

Notons pour finir que, dans les exemples présentés ici, les pourcentages des deux allèles sont soient exactement identiques, soient très différents chez les individus sains et malades. En pratique, les résultats obtenus ne sont pas forcément si extrêmes. Il est donc nécessaire d’employer des tests statistiques pour déterminer la probabilité que les résultats obtenus soient dus au hasard ou non.