Le projet de thèse proposé s’inscrit dans une démarche interdisciplinaire et un contexte de sciences ouvertes et participatives. Il vise à concevoir et mettre en œuvre des approches bioinformatiques et numériques innovantes pour analyser, comparer, interpréter et diffuser des jeux de données de données (meta)génomiques d’écosystèmes alimentaires fermentaires.
Les microorganismes sont capables de détecter de nombreux signaux environnementaux simultanément, de les transmettre et de les traiter au travers de circuits complexes pour au final prendre des décisions, modifiant leurs phénotypes. L’objet de cette thèse est d’exploiter et de modifier les circuits décisionnels des microorganismes pour le développement d’outils diagnostics permettant la détection multiplexe de biomarqueurs d’agents pathogènes.
Les microbiotes sont les communautés de microorganismes formées par des bactéries, phages, virus, archées, champignons associées à un hôte vivant, végétal, animal ou humain. Les microbiotes et leur hôte établissent un dialogue permanent qui joue un rôle crucial dans la physiologie et la santé de celui- ci.
This thesis addresses the extraction of relational information from scientific documents in Life Sciences, i.e. transforming unstructured text into machine-readable structured information. The extraction of semantic relationships between entities detected in text makes explicit and formalizes the underlying structures. Current state-of-the art methods rely on supervised machine learning. Supervised learning, and even more so recent deep learning methods, require many training examples that are costly to produce, all the more in specific domains such as Life Sciences.
Le développement d’algorithmes efficaces et parcimonieux en matière de ressources informatiques et leur implémentation sous forme de logiciels faciles à utiliser ont un très fort impact sur la communauté des sciences de la vie. Ces logiciels sont largement utilisés par de très nombreuses équipes de par le monde.