Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

GUEDOUAR Sana

Type
Stagiaire
Sujet
Évaluation de Neo4J dans le cadre de la création du graphe de connaissances Omnicrobe
Date de début
Date de fin
Encadrant(s)
Sandra Dérozier, Robert Bossy
Equipe(s)
Bibliome
StatInfOmics
Année de soutenance (pour les thèses ou les stages)
2025
Ecole/université (pour les thèses et les stages)
Université de Paris Cité
Niveau/diplôme (pour les stages)
Master 2 Bioinformatique - Biologie informatique
Description/résumé

L’unité MaIAGE développe l’application Omnicrobe (Dérozier S et al. PlosOne, 2023) qui rassemble des informations sur les habitats, les phénotypes et les usages des micro-organismes, extraites automatiquement de sources textuelles (PubMed, GenBank, DSMZ, Centres de Ressources Biologiques pour les microorganismes - CIRM). Omnicrobe forme un graphe de connaissances sur la biodiversité microbienne contenant plus d’un million de relations. Les données sont accessibles via une interface web (https://omnicrobe.migale.inrae.fr/) et une interface programmatique (API ; https://omnicrobe.migale.inrae.fr/api). Les données d’Omnicrobe sont actuellement structurées et stockées dans une base de données relationnelles PostgreSQL. Sana a pour mission d’évaluer la solution Neo4J (https://neo4j.com/fr/) afin de représenter les données sous forme de graphe. Elle s’appuie sur un jeu de données constitué d’un sous-ensemble des données Omnicrobe afin d’alimenter une base Neo4J et d’évaluer les fonctionnalités et les performances de la suite logicielle (conception, requêtage).