Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

DESSALLES Renaud

Sujet
Stochastic models for protein production: the impact of autoregulation, cell cycle and protein production interactions on gene expression
Date de début
Date de fin
Equipe(s)
Description/résumé

Le mécanisme de production des protéines, qui monopolise la majorité des ressources d’une bactérie, est hautement stochastique: chaque réaction biochimique qui y participe est due à des collisions aléatoires entre molécules, potentiellement présentes en petites quantités. La bonne compréhension de l’expression génétique nécessite donc de recourir à des modèles stochastiques qui sont à même de caractériser les différentes origines de la variabilité dans la production ainsi que les dispositifs biologiques permettant éventuellement de la contrôler.

Dans ce contexte, nous avons analysé la variabilité d’une protéine produite avec un mécanisme d’autorégulation négatif: c’est-à-dire dans le cas où la protéine est un répresseur pour son propre gène. Le but est de clarifier l’effet de l’autorégulation sur la variance du nombre de protéines exprimées. Pour une même production moyenne de protéine, nous avons cherché à comparer la variance à l’équilibre d’une protéine produite avec le mécanisme d’autorégulation et celle produite en “boucle ouverte”. En étudiant un modèle limite, avec une mise à l’échelle (scaling), nous avons pu faire une telle comparaison de manière analytique. Il apparaît que l’autorégulation réduit effectivement la variance, mais cela reste néanmoins limité : un résultat asymptotique montre que la variance ne pourra pas être réduite de plus de 50%. L’effet sur la variance à l’équilibre étant modéré, nous avons cherché un autre effet possible de l’autorégulation: nous avons observé que la vitesse de convergence à l’équilibre est plus rapide dans le cadre d’un modèle avec autorégulation.

Les modèles classiques de production des protéines considèrent un volume constant, sans phénomènes de division ou de réplication du gène, avec des ARN-polymérases et les ribosomes en concentrations constantes. Pourtant, la variation au cours du cycle de chacune de ces quantités a été proposée dans la littérature comme participant à la variabilité des protéines. Nous proposons une série de modèles de complexité croissante qui vise à aboutir à une représentation réaliste de l’expression génétique. Dans un modèle avec un volume suivant le cycle cellulaire, nous intégrons successivement le mécanisme de production des protéines (transcription et traduction), la répartition aléatoire des composés à la division et la réplication du gène. Le dernier modèle intègre enfin l’ensemble des gènes de la cellule et considère leurs interactions dans la production des différentes protéines à travers un partage commun des ARN-polymérases et des ribosomes, présents en quantités limitées. Pour les modèles où cela était possible, la moyenne et la variance de la concentration de chacune des protéines ont été déterminées analytiquement en ayant eu recours au formalisme des Processus Ponctuels de Poisson Marqués. Pour les cas plus complexes, nous avons estimé la variance au moyen de simulations stochastiques. Il apparaît que, dans l’ensemble des mécanismes étudiés, la source principale de la variabilité provient du mécanisme de production des protéines lui-même (bruit dit “intrinsèque”). Ensuite, parmi les autres aspects “extrinsèques”, seule la répartition aléatoire des composés semble avoir potentiellement un effet significatif sur la variance; les autres ne montrent qu’un effet limité sur la concentration des protéines. Ces résultats ont été confrontés à certaines mesures expérimentales, et montrent un décalage encore inexpliqué entre la prédiction théorique et les données biologiques, ce qui appelle à de nouvelles hypothèses quant aux possibles sources de variabilité.

En conclusion, les processus étudiés ont permis une meilleure compréhension des phénomènes biologiques en explorant certaines hypothèses difficilement testables expérimentalement. Des modèles étudiés, nous avons pu dégager théoriquement certaines tendances, montrant que la modélisation stochastique est un outil important pour la bonne compréhension des mécanismes d’expression génétique.

Ecole doctorale (pour les thèses)
ED574 EDMH
Directeur.trice (pour les thèses)
V. Fromion (MaIAGE) et P. Robert (RAP, INRIA Rocquencourt)
Année de soutenance (pour les thèses ou les stages)
2017
Date de soutenance (pour les thèses)
Ecole/université (pour les thèses et les stages)
Université Paris-Saclay