Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

M1/M2 - Exploitation de l’API BioloMICS dans le cadre du projet Omnicrobe

Contexte :

L’unité Mathématiques et Informatique Appliquées du Génome à l’Environnement (MaIAGE ; https://maiage.inrae.fr/) est située sur le centre INRAE (https://www.inrae.fr/) de Jouy-en-Josas. Cette unité de recherche regroupe des mathématiciens, des informaticiens, des bioinformaticiens et des biologistes qui développent des méthodes pour répondre à des questions de biologie et agro-écologie, allant de l'échelle moléculaire à celle du paysage en passant par l'étude d'individus, de populations ou d'écosystèmes. MaIAGE est structurée en cinq équipes dont l’équipe Bibliome (https://maiage.inrae.fr/fr/bibliome) qui développe des méthodes de traitement automatique des langues (TAL) et d'apprentissage automatique (ML) pour extraire des informations de textes par des ontologies dans le domaine de la biologie ; l’équipe StatInfOmics (https://maiage.inrae.fr/fr/statinfomics) qui développe et met en œuvre des méthodes statistiques et bioinformatiques dédiées à l’analyse de données “omiques” ; et la plateforme bioinformatique Migale (https://migale.inrae.fr) qui fournit des services à la communauté des sciences de la vie. Cette proposition de stage s’inscrit sur un projet commun aux trois équipes.

Missions :

L’unité MaIAGE développe l’application Omnicrobe (Dérozier S et al. PlosOne, 2023) qui rassemble des informations sur les habitats, les phénotypes et les usages des micro-organismes, extraites automatiquement de sources textuelles (PubMed, GenBank, DSMZ, Centres de Ressources Biologiques pour les Microorganismes - CIRM). Les données sont accessibles via une interface web (https://omnicrobe.migale.inrae.fr/) et une interface programmatique (API ; https://omnicrobe.migale.inrae.fr/api). Omnicrobe intégre des données issues du CIRM-BIA, du CIRM-CFBP et du CIRM-Levures, qui sont fournies par les CIRM eux-mêmes. Le ou la stagiaire aura pour mission d’automatiser cette étape de récupération des données des CIRM. Il ou elle explorera les fonctionnalités de l’API de l’outil BioloMICS (https://hal.science/hal-03859206/document), qui gére les données associées aux collections des Centres de Ressources Biologiques. Il ou elle créera un script utilisant cette API permettant la récupération des données des CIRM d’intérêt et l’intégrera dans le workflow global de traitement des données Omnicrobe. En fonction de l’avancement du stage, le ou la stagiaire pourra également modifier le workflow d’intégration des données dans la base de données relationnelle ainsi que l’interface web Omnicrobe.

 

Remarques : les objectifs du stage seront adaptés au niveau du candidat (master 1 ou master 2).

Compétences :

  • Python
  • Snakemake
Type
Stage
Durée
3 à 6 mois
Date de début
Date limite de candidature
Contact
Sandra Dérozier, sandra.derozier@inrae.fr
Valentin Loux, valentin.loux@inrae.fr