Intitulé du projet
              Ecologically-informed Microbiome Transformers for AI-driven Metagenomics
          État du contrat
              Accepté
          Année de soumission
              2025
          Programme / appel / défi concerné + année
              Starting Package 2025 GS LSH Université Paris-Saclay
          Equipe(s)
          StatInfOmics
              Coordinateur·trice (nom et prénom) MaIAGE et/ou INRAE
              G. Gautreau
          Nom(s) du(des) participant(s) - MaIAGE
              G. Gautreau ; T. Lacroix
          Année de démarrage - Année de fin de projet
              2025-2027
          Date de fin du contrat
              Résumé
              Les microbiotes façonnent la santé, l’agronomie et les cycles biogéochimiques, mais leur complexité échappe encore aux méthodes classiques. Ce projet développera le premier Transformer « écologiquement informé » entraîné sur les 2 millions d’échantillons du MicrobeAtlas. La variante BERT classera biomes et détectera espèces clés ; la variante GPT générera des communautés synthétiques pour l’écologie appliquée. L’approche repose sur une tokenisation par rang d’abondance et l’ajout de tokens environnementaux (biome, pathologie, aliment). Les modèles produits seront rendus disponibles en open‑source avec les jeux de données d’entraînement et les codes reproductibles. Ces modèles constitueront la brique IA nécessaire pour une écologie microbienne de précision.