BioNumbers, une base de données quantitatives en biologie cellulaire et moléculaire

Licence de l'article
Présentation

Présentation de la base de données Bionumbers, qui recense des valeurs utiles en biologie (concentrations de différentes biomolécules dans les cellules, temps de génération, tailles caractéristiques, vitesses de synthèse...)

La base de données BioNumbers est née en 2007 de l’effort conjoint de plusieurs chercheurs du département de biologie des systèmes de l’université d’Harvard ; elle est aujourd’hui développée au sein du Milo Lab du Weizmann Institute of Science (Israël).

Elle rassemble des données biologiques quantifiées concernant principalement les échelles moléculaires et cellulaires, ainsi que, dans une moindre mesure, d’autres échelles comme celle de la biosphère. Elle a été conçue pour fonctionner de façon collaborative : ses utilisateurs sont encouragés à soumettre des données disponibles dans la littérature, et à commenter les fiches des données déjà enregistrées dans la base.

Retour au début

Quelques exemples de BioNumbers

Quantités et concentrations

Durées et vitesses

  • Quelle est la demi-vie des ARNm dans une cellule de Saccharomyces cerevisiae ? Vingt minutes.
  • Quel est le temps moyen de génération de la chlorelle à la lumière, en conditions aérobies et à 25 °C ? 11 heures.
  • Quelle est la durée minimale des cycles cellulaires lors du développement embryonnaire précoce de Drosophila melanogaster ? 8 minutes.
  • Quelles sont les vitesses de transcription et de traduction chez d’Escherichia coli ? Environ 45 bases/s et 15 acides aminés/s.
  • Quel est le flux de molécules d’eau traversant une protéine aquaporine de type 1 ? 5.108 molécules/s.
  • Quelle est la durée du renouvellement complet des cellules de la cornée de l’œil humain ? De l’ordre de 7 jours.
  • Quelle est la durée du renouvellement complet des cellules de l’épithélium de l’intestin grêle ? De l’ordre de 3-4 jours.

Tailles

  • Quel est le volume du noyau d’une cellule HeLa ? 690 µm3.
  • Quel est le volume occupé par l’amidon dans les chloroplastes d’Arabidopsis thaliana ? 15 %.
  • Quelle est la taille du génome du bactériophage Lambda ? 48 502 bp.

Valeurs diverses

Retour au début

Les fiches Bionumbers

Chaque nombre de la base de données est accompagné de son unité ainsi que d’une attribution biologique précise (le plus souvent un organisme modèle, un type ou une lignée cellulaire). La référence correspondante dans la littérature primaire est indiquée et fréquemment accompagnée d’extraits du texte de l’article (qui le plus souvent n’est pas lui-même en accès libre) relatifs à la caractérisation précise de la grandeur en question, à la méthodologie suivie pour la calculer ou la mesurer, ainsi que des commentaires permettant de cerner son domaine de validité. Ces informations sont complétées par une liste des related BioNumbers disponibles.

Exemple d’une fiche de la base de données BioNumbers relative à l’ARN polymérase III, enzyme qui intervient dans la synthèse de l’ARNr 5S, des ARNt et d’autres petits ARN dans les cellules eucaryotes.

ID

103657

Grandeur

Vitesse d’élongation de l’ARN polymérase III

Organisme

Levure bourgeonnante Saccharomyces cerevisiae

Intervalle

21-22

Unité

Nucléotides/seconde

Référence

Matsuzaki H, Kassavetis GA, Geiduschek EP. Analysis of RNA chain elongation and termination by Saccharomyces cerevisiae RNA polymerase III. J Mol Biol. 1994 Jan 28 235(4): 1173-92.

Référence PubMed ID

8308883

Méthode

Transcription in vitro et libération du transcrit. p. 1175, colonne de gauche, 3e paragraphe : « Des autoradiographies ont été scannées avec un densitomètre laser et analysées avec un logiciel développé par AMBIS (San Diego). »

Commentaire

Dans le résumé de l’article : « […] à 20 °C avec 1 mmol/L de NTP [nucléosides tri-phosphates], les chaînes dont l’élongation est la plus rapide atteignent une vitesse moyenne de 29 nucléotides/seconde, la valeur médiane est de 21 à 22 nucléotides/seconde » […]

Saisie

Uri M.

Date d’ajout

15 mars 2009, 10h10

Date de dernière modification

7 mai 2015, 7h00

Version

11

Lien permanent

http://bionumbers.hms.harvard.edu/bionumber.aspx?s=n&id=103657&ver=11

Différentes catégories (Popular BioNumbers, Recent BioNumbers, Amazing BioNumbers, etc.) permettent d’avoir un aperçu des ressources disponibles ; les fonctions « rechercher » (search) et « parcourir » (browse) permettent d’utiliser efficacement la base de données de façon plus systématique.

Plusieurs collections réalisées à partir de la base BioNumbers permettent d’accéder facilement à des données-clé correspondant aux ordres de grandeurs importants en biologie moléculaire et cellulaire, dont une synthèse est proposée dans le tableau suivant.

 

Propriétés

E. coli

S. cerevisiae

Cellules HeLa (humain)

Tailles

Longueur

2–4 µm

3–6 µm

Volume cellulaire

0,3–5 µm³

20–160 µm³

100–10 000 µm³

Épaisseur des membranes

4–10 nm

Diamètre moyen d’une protéine

3–6 nm

Paire de bases

2 nm (diamètre) x 0,34 nm (hauteur)

Molécule d’eau

~ 0,3 nm

Génomes

Taille du génome

4,6 Mb

12 Mb

3,2 Gb

Nombre de gènes codant une protéine

4 300

6 600

21 000

Longueur des sites régulateurs

10–20 bp

5–10 bp

Longueur des promoteurs

~ 100 bp

~ 1000 bp

~ 104–105 bp

Longueur des gènes

~ 1 000 bp

~ 1 000 bp

~ 104–106 bp (avec les introns)

Concentrations

Protéines par µm³ de cellule

2–4 × 106

Concentration d’une protéine donnée par cellule

~ 1 nM

~ 10 pM

~ 0,1–1 pM

Protéines par cellule

~ 106

~ 108

~ 1010

Ribosomes/cellule

~ 104

~ 105

~ 106

 

Vitesses et durées

Temps de fixation d’un facteur de transcription à l’ADN

~ 1 s

Vitesse de réplication par l’ADN polymérase

200–1 000 nt/s

40 nt/s

Vitesse de transcription par l’ARN polymérase

10–100 nt/s

Temps de transcription d’un gène

< 1 min

~ 1 min

~ 30 min (en incluant la maturation des ARNm)

Durée de vie d’un ARNm

3 min

30 min

10 h

Vitesse de traduction d’un ribosome

10–20 AA/s

Temps de traduction d’une protéine (300 AA)

~ 1 min

Temps de repliement d’une protéine

1 ms – 1 min

Durée de vie d’une protéine

1 h

0,3–3 h

10–100 h

Temps de diffusion d’une protéine à travers une cellule (D ~ 10 µm²/s)

~ 0,01 s

~ 0,2 s

~ 1-10 s

Temps de diffusion d’une petite molécule à travers une cellule (D ~ 100 µm²/s)

~ 0,001 s

~ 0,03 s

~ 0,1–1 s

Transitions entre états protéiques (actif/inactif)

1–100 µs

Temps pour atteindre l’équilibre de liaison petites molécules/protéines

1–1000 ms (affinité : 1 µM – 1 nM)

Temps de génération

20–40 min (en phase de croissance exponentielle)

1–2 h

15–30 h

Erreurs

Taux de mutation

~ 10-8–10-10/bp/réplication

Erreur d’incorporation lors de la transcription

10-4–10-5 par nucléotide

Erreur d’incorporation lors de la traduction

10-3–10-4 par acide aminé

Taille des génomes

  • E. coli ~ 5 Mb
  • S. cerevisiae (levure de boulanger) ~ 12 Mb
  • C. elegans (nématode) ~ 100 Mb
  • D. melanogaster (drosophile) ~ 120 Mb
  • A. thaliana (arabette des dames) ~ 120 Mb
  • M. musculus (souris) ~ 2,5 Gb
  • H. sapiens (être humain) ~ 2,9 Gb
  • T. aestivum (blé) ~ 16 Gb

Sources (contenant également des infographies téléchargeables gratuitement) :

Retour au début

Les enjeux des données quantifiées en biologie

Pour ses concepteurs, une telle base de données répond à un besoin pour les chercheurs en biologie moléculaire. En effet, alors que les nouvelles techniques de mesure et l’accroissement de leur productivité permettent la mise à disposition de grandes quantités de données biologiques quantifiées de toute nature – disponibles pour partie dans la littérature primaire –, il n’est pas évident d’accéder directement à ces valeurs chiffrées qui sont pourtant souvent nécessaires pour conduire des expériences et en interpréter les résultats, et indispensables pour élaborer de nouveaux modèles quantitatifs.

Les informations précises et référencées accompagnant chaque BioNumber permettent de prendre en compte les enjeux spécifiques de la quantification en biologie que sont la variabilité du vivant (un intervalle ou une distribution sont souvent plus informatifs qu’une moyenne ou une médiane), la diversité du matériel biologique utilisé au laboratoire, celle des conditions expérimentales adoptées, ou encore des méthodes et procédures de mesure suivies. L’usage qui en peut être fait est ainsi variable : on peut chercher à en tirer des ordres de grandeur, ou extraire des valeurs plus spécifiques dont la précision et la validité dépendent de conditions données – on trouvera ainsi dans certains cas des fiches correspondant à une « même » grandeur déterminée dans des conditions expérimentales ou avec des méthodes différentes.

Il est intéressant de remarquer que, de façon générale, les données disponibles sont de deux types : certaines résultent directement de mesures expérimentales (et d’une analyse statistique), tandis que d’autres sont le produit d’une modélisation plus ou moins complexe. Toutes peuvent être affinées voire remises en question, au gré de l’amélioration des appareils et des techniques de mesure, ou de la prise en compte de nouvelles données et de nouvelles hypothèses dans les modèles existants, voire de l’élaboration de nouveaux modèles. On peut donner comme exemple d’une telle démarche les travaux concernant le nombre de cellules du corps humain, et celui des bactéries du microbiote qui le colonisent (Sender et al., 2016).

Les données de la base BioNumbers peuvent enfin être utilisées de façon heuristique pour des estimations (BioEstimates) permettant de mettre en évidence des insuffisances ou des points aveugles de la compréhension plutôt qualitative des phénomènes qui a cours habituellement en biologie moléculaire. La mise à disposition de données quantifiées variées permet d’essayer de transposer en biologie moléculaire ce que physiciens et ingénieurs appellent classiquement les « problèmes de Fermi » : en raisonnant à partir d’ordres de grandeur et d’approximations, on peut développer un point de vue renouvelé sur de nombreux problèmes biologiques, et y apporter des solutions valables.

 
Comment la bactérie Escherichia coli a-t-elle le temps de répliquer son génome ?

Son génome comporte environ 5 millions de paires de bases azotées (bp), et sa vitesse de réplication varie entre 200 et 1000 bp/seconde. Par conséquent, les deux réplisomes (associés aux deux fourches de réplications) auraient en théorie besoin d’au moins 2500 secondes (soit environ 42 minutes) pour répliquer le génome entier, durée bien supérieure au temps de génération minimum de cette bactérie, qui est d’environ 20 minutes. Cela semble impossible… Il s’avère en fait que, dans des conditions de culture idéales, il existe chez E. coli des fourches de réplications imbriquées au niveau desquelles commence à être répliqué l’ADN qu’on retrouvera dans les cellules qui se formeront lors des divisions n+1 et n+2, alors même que la réplication du génome pour les cellules filles de la génération immédiatement suivante (n) n’est pas achevée.

Adapté de http://dx.doi.org/10.1016/j.cell.2010.06.019

Les concepteurs de la base BioNumbers espèrent qu’elle facilitera le développement d’une « numératie biologique » (biological numeracy) dans le domaine de l’enseignement des sciences du vivant. La publication par Ron Milo et Rob Phillips en 2016 de l’ouvrage Cell biology by the numbers (disponible gratuitement en ligne en version auteur) y contribue également.

Retour au début

Références

Sur Bionumbers

  1. BioNumbers, the database of useful biological numbers
  2. Ron Milo, Paul Jorgensen, Uri Moran, Griffin Weber, Michael Springer, « BioNumbers – the database of key numbers in molecular and cell biology », Nucleic Acids Research (2010) 38 (suppl_1): D750-D753. https://doi.org/10.1093/nar/gkp889
  3. Rob Phillips and Ron Milo, « A feeling for the numbers in biology » , PNAS, vol. 106 no. 51, 21465-21471, December 22, 2009 https://doi.org/10.1073/pnas.0907732106
  4. Ron Milo, Rob Phillips, Cell biology by the numbers, New York, NY : Garland Science, Taylor & Francis Group, 2016, 356 pages

D’autres bases de données plus spécialisées

  1. Données sur les tailles des génomes animaux, le nombre de chromosomes
  2. Données sur les enzymes
  3. Données concernant exclusivement Escherichia coli
  4. Données concernant la biologie moléculaire et la génétique de Saccharomyces cerevisiae
  5. Plant DNA C-values Database

Pour aller plus loin

  1. Captations vidéo de cours de Ron Milo « Cell Biology by the Numbers »
  2. Quelques documents associés à ces cours
Retour au début

Pour citer cet article

Harold Lopparelli, BioNumbers, une base de données quantitatives en biologie cellulaire et moléculaire, Planet-Vie, Lundi 25 septembre 2017, http://planet-vie.ens.fr/article/2442/bionumbers-base-donnees-quantitatives-biologie-cellulaire-moleculaire, voir