NARCI Romain

Sujet
Modélisation et inférence par une approche couplant filtrage et algorithmes stochastiques pour des dynamiques épidémiques partiellement observées
Date de début
Date de fin
Encadrant(s)
E. Vergu (MaIAGE), M.Delattre (AgroParisTech)
Equipe(s)
Description/résumé

Le cadre de cette thèse est l’inférence pour des dynamiques épidémiques partiellement observées. Le développement d’approches pour l’estimation de paramètres de ces dynamiques à partir des observations de leur suivi est un premier enjeu important, cependant difficile du point de vue statistique. En effet, les données sont généralement recueillies à des temps discrets et sujettes à des erreurs de report et/ou de mesure. A cela s’ajoute la présence de composantes non-observées dans les modèles mécanistes servant à décrire les épidémies, rendant nécessaire l’utilisation d’algorithmes pour l’inférence (cadre des modèles à variables latentes). Par ailleurs, des dynamiques multiples d’une même épidémie peuvent être observées dans des sites géographiques distincts ou à des périodes différentes. La prise en compte explicite de la variabilité inter-épidémies dans la modélisation constitue un deuxième enjeu.
Nous considĂ©rons des dynamiques Ă©pidĂ©miques en population de taille finie modĂ©lisĂ©es par des processus Markoviens de sauts dĂ©pendant de la densitĂ©. A travers une approche s’appuyant sur leur approximation par des processus de diffusion, les dynamiques Ă©pidĂ©miques sont dĂ©crites par des processus Gaussiens Ă  petite variance. En considĂ©rant Ă©galement une approximation Gaussienne du modèle des observations, nous nous plaçons dans le cadre des modèles Ă  espace d'Ă©tat Gaussiens et linĂ©aires en les Ă©tats du système. Dans ces modèles, la vraisemblance des observations peut s'obtenir via des techniques de filtrage de Kalman, que nous combinons avec une procĂ©dure d'optimisation pour estimer les paramètres. Puis, dans le cas d'Ă©pidĂ©mies multiples, nous utilisons le cadre des modèles Ă  effets mixtes permettant de dĂ©crire de façon plus fine et originale les diffĂ©rentes sources de variabilitĂ© entre plusieurs jeux de donnĂ©es recueillis Ă  partir d'Ă©pidĂ©mies multisites ou rĂ©currentes. Dans ces modèles, des distributions sont spĂ©cifiĂ©es pour les paramètres, ce qui permet de prendre en compte la variabilitĂ© inter-Ă©pidĂ©mies. Pour estimer les paramètres de ces distributions, nous combinons des techniques de filtrage de Kalman et l’algorithme stochastique SAEM. Dans un premier temps, les diffĂ©rentes mĂ©thodes dĂ©veloppĂ©es dans cette thèse sont Ă©valuĂ©es sur des jeux de donnĂ©es simulĂ©es d’épidĂ©mies dĂ©crites par des processus Markoviens de sauts. La mise en Ĺ“uvre sur des donnĂ©es rĂ©elles porte sur l'incidence quotidienne de syndromes grippaux entre 1990 et 2017 en France (Ă©pidĂ©mies rĂ©currentes) et les donnĂ©es hospitalières relatives Ă  la Covid-19 dans 12 rĂ©gions de la France mĂ©tropolitaine pendant le printemps 2020 (Ă©pidĂ©mies multisites). 

Ecole doctorale (pour les thèses)
ED574 EDMH
Directeur.trice (pour les thèses)
C. Laredo (MaIAGE)
Année de soutenance (pour les thèses ou les stages)
2022
Date de soutenance (pour les thèses)
Ecole/université (pour les thèses et les stages)
Université Paris-Saclay