Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

GASSIN Stelia-Wendy

Type
Stagiaire
Sujet
Analyses pangénomiques de génomes bactériens pour l’identification des gènes modulant l’infection par des phages
Date de début
Date de fin
Encadrant(s)
Nacer Mohellibi, Christelle Hennequet-Antier
Equipe(s)
Migale
Contrat de recherche
GS Biosphera DISSECT
Année de soutenance (pour les thèses ou les stages)
2026
Ecole/université (pour les thèses et les stages)
Université Paris-Saclay
Niveau/diplôme (pour les stages)
M1 Bio-informatique et biostatistiques
Description/résumé

 

Enterococcus cecorum (Ec) est un pathogène responsable d’environ 15 % de pertes dans les élevages de poulets de chair. L’unité Micalis de INRAE en partenariat avec l’unité MaIAGE de INRAE propose de développer une approche innovante qui consiste à utiliser des phages contre les infections à Ec dans un contexte prioritaire de santé globale et de lutte non antibiotique contre un pathogène majeur en aviculture. 

L’objectif principal du stage est d’identifier les gènes bactériens qui modulent la sensibilité aux phages en utilisant des approches pangénomiques. Nous disposons d’une collection de plus de 170 souches Ec séquencées et représentatives de la diversité génétique de Ec, et près de 400 génomes sont disponibles en considérant les banques de données .

En préambule, il sera demandé au stagiaire d’annoter la collection de génomes d’Ec disponibles à l’aide d’outils d’annotation standardisée de génomes prokaryotes tels que Prokka [1] ou Bakta [2] puis de mener des analyses de génomiques comparatives sur ces génomes afin d’identifier des opérons qui pourraient être impliqués dans le processus infectieux. Dans ce contexte, des approches de pangénomiques avec des outils tels que Roary [3] ou PPanGGOLiN [4] seront utilisés afin de mettre en évidence des gènes spécifiques d’une part et le core-génome d’autre part.

Les analyses d’association pangénomiques (GWAS) ont montré leur efficacité pour établir la relation génotype-phénotype chez les bactéries. Les données expérimentales de spectres d’hôte de deux phages virulents qui caractérisent la sensibilité à l’infection seront analysées afin de déterminer les gènes statistiquement associés à la sensibilité du phage. Le stage consistera à mettre en œuvre les analyses GWAS en utilisant la méthode développée dans le logiciel Scoary2 [5] et permettra de caractériser les gènes de Ec impliqués dans la modulation de l’infection ‘sensible’ ou ‘résistant’ à chacun des phages. Afin d’aller plus loin, un modèle de prédiction basé sur des méthodes d’apprentissage automatique pourra être construit à partir d’un sous-ensemble de gènes annotés et expertisés comme présentant un intérêt majeur dans l’infection. Les résultats obtenus permettront de mieux comprendre les mécanismes de résistance et d’anticiper la sensibilité de nouvelles souches Ec.


Bibliographie

[1] Prokka : Seemann T. Prokka: rapid prokaryotic genome annotation Bioinformatics 2014 Jul 15;30(14):2068-9. PMID:24642063 DOI:10.1093/bioinformatics/btu153 CFF

[2] Bakta : Schwengers O., Jelonek L., Dieckmann M. A., Beyvers S., Blom J., Goesmann A. (2021). Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification. Microbial Genomics, 7(11). https://doi.org/10.1099/mgen.0.000685

[3] Roary : Andrew J. Page, Carla A. Cummins, Martin Hunt, Vanessa K. Wong, Sandra Reuter, Matthew T. G. Holden, Maria Fookes, Daniel Falush, Jacqueline A. Keane, Julian Parkhill, "Roary: Rapid large-scale prokaryote pan genome analysis", Bioinformatics, 2015;31(22):3691-3693 doi:10.1093/bioinformatics/btv421

[4] PPanGGOLiN: Depicting microbial diversity via a partitioned pangenome graph Gautreau G et al. (2020) PLOS Computational Biology 16(3): e1007732. doi: 10.1371/journal.pcbi.1007732 

[5] Scoary2 : Roder, T. et al. Scoary2 : rapid association of phenotypic multi-omics data with microbial pan-genomes. Genome Biol 25, 93 (2024). https://doi.org/10.1186/s13059-024-03233-7