Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

NARCI Romain

Type
Doctorant.e
Sujet
Modélisation et inférence par une approche couplant filtrage et algorithmes stochastiques pour des dynamiques épidémiques partiellement observées
Date de début
Date de fin
Encadrant(s)
E. Vergu (MaIAGE), M.Delattre (AgroParisTech)
Equipe(s)
Dynenvie
Ecole doctorale (pour les thèses)
ED574 EDMH
Directeur.trice (pour les thèses)
C. Laredo (MaIAGE)
Année de soutenance (pour les thèses ou les stages)
2022
Date de soutenance (pour les thèses)
Ecole/université (pour les thèses et les stages)
Université Paris-Saclay
Description/résumé

Le cadre de cette thèse est l’inférence pour des dynamiques épidémiques partiellement observées. Le développement d’approches pour l’estimation de paramètres de ces dynamiques à partir des observations de leur suivi est un premier enjeu important, cependant difficile du point de vue statistique. En effet, les données sont généralement recueillies à des temps discrets et sujettes à des erreurs de report et/ou de mesure. A cela s’ajoute la présence de composantes non-observées dans les modèles mécanistes servant à décrire les épidémies, rendant nécessaire l’utilisation d’algorithmes pour l’inférence (cadre des modèles à variables latentes). Par ailleurs, des dynamiques multiples d’une même épidémie peuvent être observées dans des sites géographiques distincts ou à des périodes différentes. La prise en compte explicite de la variabilité inter-épidémies dans la modélisation constitue un deuxième enjeu.
Nous considérons des dynamiques épidémiques en population de taille finie modélisées par des processus Markoviens de sauts dépendant de la densité. A travers une approche s’appuyant sur leur approximation par des processus de diffusion, les dynamiques épidémiques sont décrites par des processus Gaussiens à petite variance. En considérant également une approximation Gaussienne du modèle des observations, nous nous plaçons dans le cadre des modèles à espace d'état Gaussiens et linéaires en les états du système. Dans ces modèles, la vraisemblance des observations peut s'obtenir via des techniques de filtrage de Kalman, que nous combinons avec une procédure d'optimisation pour estimer les paramètres. Puis, dans le cas d'épidémies multiples, nous utilisons le cadre des modèles à effets mixtes permettant de décrire de façon plus fine et originale les différentes sources de variabilité entre plusieurs jeux de données recueillis à partir d'épidémies multisites ou récurrentes. Dans ces modèles, des distributions sont spécifiées pour les paramètres, ce qui permet de prendre en compte la variabilité inter-épidémies. Pour estimer les paramètres de ces distributions, nous combinons des techniques de filtrage de Kalman et l’algorithme stochastique SAEM. Dans un premier temps, les différentes méthodes développées dans cette thèse sont évaluées sur des jeux de données simulées d’épidémies décrites par des processus Markoviens de sauts. La mise en œuvre sur des données réelles porte sur l'incidence quotidienne de syndromes grippaux entre 1990 et 2017 en France (épidémies récurrentes) et les données hospitalières relatives à la Covid-19 dans 12 régions de la France métropolitaine pendant le printemps 2020 (épidémies multisites).