Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

Un nouvel algorithme de machine learning pour l’inférence de modèles à variables latentes généraux : un levier pour la sélection variétale via des modèles de prédiction de phénotypes

Résumé

Les modèles à variables latentes sont très utilisés par de larges communautés pour analyser des données complexes, hétérogènes et dépendantes. Ils permettent en particulier de modéliser des phénomènes partiellement observés, par exemple avec des structures sous-jacentes inconnues. Ces modèles sont très riches du point de vue de la modélisation, mais difficiles à calibrer. Des méthodes ont été développées pour réaliser l’estimation de paramètres par maximum de vraisemblance avec des garanties théoriques de convergence dans des cadres très limités. Des chercheurs de INRAE, de CentraleSupelec, de l’Université de Lille et de l’Université de Technologie de Compiègne ont proposé une nouvelle méthode de machine learning pour estimer les paramètres d’un modèle à variables latentes très général. Plus précisément, ils ont développé un algorithme du gradient stochastique pré-conditionné et ont établi des garanties de convergence. De plus, la méthode permet d’obtenir simultanément les estimateurs des paramètres par maximum de vraisemblance et des intervalles de confiance associés. Une extension au cas de paramètres de grande dimension est en cours. Du point de vue pratique, ce type de développement permettra d’inclure dans les modèles de prédiction phénotypiques, par exemple des modèles de culture ou d’écophysiologie des plantes, des variables descriptives de grande dimension, telles que des marqueurs génétiques ou des spectres proches infra rouges, et d’identifier les localisations influentes du génome ou du spectre, dans un objectif de sélection génétique.

Contact : Estelle Kuhn
Unité : MaIAGE
Département : Mathnum/ MICA
Centre INRAE : Ile de France Jouy-en-Josas
INRAE 2030 Orientations scientifiques (OS) et Orientations de politiques générales (OP) : OS 5.1 - OS 1.3
Grands Objectifs Scientifiques (GOS) MathNum : GOS 2
Mots-clés : Modèle à variables latentes, inférence, gradient stochastique, modèles graphiques, modèles à effets
mixtes, modèles de prédiction phénotypiques

 

 Evolution des estimations des sept paramètres d’un modèle de croissance au cours des itérations de l’algorithme en étude de simulation