DESSALLES Renaud

Sujet
Stochastic models for protein production: the impact of autoregulation, cell cycle and protein production interactions on gene expression
Date de début
Date de fin
Equipe(s)
Description/résumé

Le mécanisme de production des protéines, qui monopolise la majorité des ressources d’une bactérie, est hautement stochastique: chaque réaction biochimique qui y participe est due à des collisions aléatoires entre molécules, potentiellement présentes en petites quantités. La bonne compréhension de l’expression génétique nécessite donc de recourir à des modèles stochastiques qui sont à même de caractériser les différentes origines de la variabilité dans la production ainsi que les dispositifs biologiques permettant éventuellement de la contrôler.

Dans ce contexte, nous avons analysĂ© la variabilitĂ© d’une protĂ©ine produite avec un mĂ©canisme d’autorĂ©gulation nĂ©gatif: c’est-Ă -dire dans le cas oĂą la protĂ©ine est un rĂ©presseur pour son propre gène. Le but est de clarifier l’effet de l’autorĂ©gulation sur la variance du nombre de protĂ©ines exprimĂ©es. Pour une mĂŞme production moyenne de protĂ©ine, nous avons cherchĂ© Ă  comparer la variance Ă  l’équilibre d’une protĂ©ine produite avec le mĂ©canisme d’autorĂ©gulation et celle produite en “boucle ouverte”. En Ă©tudiant un modèle limite, avec une mise Ă  l’échelle (scaling), nous avons pu faire une telle comparaison de manière analytique. Il apparaĂ®t que l’autorĂ©gulation rĂ©duit effectivement la variance, mais cela reste nĂ©anmoins limitĂ© : un rĂ©sultat asymptotique montre que la variance ne pourra pas ĂŞtre rĂ©duite de plus de 50%. L’effet sur la variance Ă  l’équilibre Ă©tant modĂ©rĂ©, nous avons cherchĂ© un autre effet possible de l’autorĂ©gulation: nous avons observĂ© que la vitesse de convergence Ă  l’équilibre est plus rapide dans le cadre d’un modèle avec autorĂ©gulation.

Les modèles classiques de production des protéines considèrent un volume constant, sans phénomènes de division ou de réplication du gène, avec des ARN-polymérases et les ribosomes en concentrations constantes. Pourtant, la variation au cours du cycle de chacune de ces quantités a été proposée dans la littérature comme participant à la variabilité des protéines. Nous proposons une série de modèles de complexité croissante qui vise à aboutir à une représentation réaliste de l’expression génétique. Dans un modèle avec un volume suivant le cycle cellulaire, nous intégrons successivement le mécanisme de production des protéines (transcription et traduction), la répartition aléatoire des composés à la division et la réplication du gène. Le dernier modèle intègre enfin l’ensemble des gènes de la cellule et considère leurs interactions dans la production des différentes protéines à travers un partage commun des ARN-polymérases et des ribosomes, présents en quantités limitées. Pour les modèles où cela était possible, la moyenne et la variance de la concentration de chacune des protéines ont été déterminées analytiquement en ayant eu recours au formalisme des Processus Ponctuels de Poisson Marqués. Pour les cas plus complexes, nous avons estimé la variance au moyen de simulations stochastiques. Il apparaît que, dans l’ensemble des mécanismes étudiés, la source principale de la variabilité provient du mécanisme de production des protéines lui-même (bruit dit “intrinsèque”). Ensuite, parmi les autres aspects “extrinsèques”, seule la répartition aléatoire des composés semble avoir potentiellement un effet significatif sur la variance; les autres ne montrent qu’un effet limité sur la concentration des protéines. Ces résultats ont été confrontés à certaines mesures expérimentales, et montrent un décalage encore inexpliqué entre la prédiction théorique et les données biologiques, ce qui appelle à de nouvelles hypothèses quant aux possibles sources de variabilité.

En conclusion, les processus étudiés ont permis une meilleure compréhension des phénomènes biologiques en explorant certaines hypothèses difficilement testables expérimentalement. Des modèles étudiés, nous avons pu dégager théoriquement certaines tendances, montrant que la modélisation stochastique est un outil important pour la bonne compréhension des mécanismes d’expression génétique.

Ecole doctorale (pour les thèses)
ED574 EDMH
Directeur.trice (pour les thèses)
V. Fromion (MaIAGE) et P. Robert (RAP, INRIA Rocquencourt)
Année de soutenance (pour les thèses ou les stages)
2017
Date de soutenance (pour les thèses)
Ecole/université (pour les thèses et les stages)
Université Paris-Saclay