Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

EMT4AIMs

Intitulé du projet
Ecologically-informed Microbiome Transformers for AI-driven Metagenomics
État du contrat
Accepté
Année de soumission
2025
Programme / appel / défi concerné + année
Starting Package 2025 GS LSH Université Paris-Saclay
Equipe(s)
StatInfOmics
Coordinateur·trice (nom et prénom) MaIAGE et/ou INRAE
G. Gautreau
Nom(s) du(des) participant(s) - MaIAGE
G. Gautreau ; T. Lacroix
Année de démarrage - Année de fin de projet
2025-2027
Date de fin du contrat
Résumé
Les microbiotes façonnent la santé, l’agronomie et les cycles biogéochimiques, mais leur complexité échappe encore aux méthodes classiques. Ce projet développera le premier Transformer « écologiquement informé » entraîné sur les 2 millions d’échantillons du MicrobeAtlas. La variante BERT classera biomes et détectera espèces clés ; la variante GPT générera des communautés synthétiques pour l’écologie appliquée. L’approche repose sur une tokenisation par rang d’abondance et l’ajout de tokens environnementaux (biome, pathologie, aliment). Les modèles produits seront rendus disponibles en open‑source avec les jeux de données d’entraînement et les codes reproductibles. Ces modèles constitueront la brique IA nécessaire pour une écologie microbienne de précision.