Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

Procope-Mamert Sylvain

Type
Doctorant.e
Sujet
Algorithmes d'inférence pour des modèles de Markov cachés hiérarchiques à observations non linéaires - applications à l'analyse de données omiques suivies au cours du temps.
Date de début
Date de fin
Equipe(s)
Dynenvie
StatInfOmics
Contrat de recherche
Financement région AI4IDF
Ecole doctorale (pour les thèses)
ED574 EDMH
Directeur.trice (pour les thèses)
Nicolas CHOPIN, Maud DELATTRE et Guillaume KON KAM KING
Année de soutenance (pour les thèses ou les stages)
2026
Ecole/université (pour les thèses et les stages)
Université Paris-Saclay
Description/résumé
Les travaux conduits dans cette thèse porteront sur des modèles de Markov cachés hiérarchiques à observations non linéaires pour décrire les mécanismes sous-jacents à l’observation de séquences temporelles avec une dépendance spatiale. Ces modèles sont intéressants dans de nombreuses applications, notamment pour l’analyse de données omiques résolues en temps, qui présentent souvent une dépendance spatiale le long du génome. Estimer les paramètres qui régissent les dynamiques temporelles et reconstruire les états cachés du modèle sont des questions cruciales en pratique car elles permettent d’accéder à une meilleure compréhension des mécanismes physiques ou biologiques à l'oeuvre dans la génération des données. On s’intéressera plus spécifiquement au cas où les dynamiques temporelles observées sont non-linéaires et où les états cachés combinent des composantes discrètes et des composantes continues. Dans ce contexte peu abordé dans la littérature, la fonction de vraisemblance n’est pas classique et empêche l'utilisation des méthodes standard (Kalman/Baum-Welch). Dans cette thèse, on se propose de développer des algorithmes pour estimer les paramètres et reconstruire les états cachés à partir des séquences observées, en étudiant leurs propriétés théoriques et leur implémentation pratique. On se placera dans le cadre Bayésien qui permet une quantification naturelle de l'incertitude d'estimation. 
Ces travaux sont notamment motivés par des données originales de transcriptomique suivie au cours du temps, collectées par des partenaires du projet et qui permettront une application directe des premiers travaux réalisés.