Les équipes Bibliome et BioSys ont développé les ontologies et les corpus annotés suivants :
Ontologies
- BiPON (Bacterial interlocked Process ONtolgy)
Contexte
Les technologies haut débit produisent d’énormes quantités de données hétérogènes à tous les niveaux de la cellule. En parallèle, les mécanismes moléculaires impliqués dans l’adaptation de la cellule aux changements environnements sont de mieux en mieux connus. La structuration de ces données et des connaissances biologiques exige l’élaboration d’outils et des méthodes intégratifs pour partager et extraire des informations. Les bio-ontologies sont habituellement appropriés pour appréhender ce problème d’intégration car elles peuvent intrinsèquement formaliser et organiser différents niveaux et sources de connaissances, informations et données. Le défi est alors de disposer d’une ontologie qui pourrait imbriquer tous les niveaux cellulaires, allant d’une molécule unique à un processus cellulaire de plus haut niveau et de relier ces entités aux données omiques, informations de séquence, jusqu’aux paramètres (vitesse de réaction, constante d’association, etc.). Une telle ontologie n’existe pas actuellement.
En collaboration avec le LRI (https://www.lri.fr/), nous avons développé BiPON, une ontologie permettant une représentation systémique multi-échelles des processus cellulaires bactériens et de relier ces processus à leurs modèles mathématiques. BiPON est composé de deux sous-ontologies, bioBiPON et modelBiPON. bioBiPON vise à organiser l’information biologique de façon systémique tandis que modelBiPON a pour but de décrire les modèles mathématiques (y compris les paramètres) associés à chaque processus biologique. Pour preuve de concept, nous déployons BiPON sur le processus de traduction dans son plus haut niveau de détails. Les deux sous-ontologies sont reliées par raisonnement automatique en utilisant des règles de jointure. Les processus biologiques sont donc automatiquement liés à leurs modèles mathématiques intégrant des paramètres spécifiques. 41 % des classes de BiPON ont été importées de différentes bio-ontologies existantes, tandis que les autres ont été manuellement définies et organisées. Actuellement, BiPON intègre les principaux processus d’expression des gènes bactériens. Ces processus sont suffisamment représentatifs pour regrouper la plupart des difficultés rencontrées dans la description formelle de la connaissance.
La formalisation de la connaissance utilisée dans BiPON est hautement flexible et générique. La plupart des processus cellulaires connus, les nouveaux participants ou d'autres sources de connaissance pourraient être insérés dans BiPON et reliés à leurs modèles mathématiques s'ils existent. BiPON ouvre donc de nouvelles perspectives prometteuses pour l'intégration et le partage des connaissance et pourrait être utilisée par de nombreuses communautés en biologie, biologie des systèmes, bioinformatiques ainsi que par la communauté émergente des modélisateurs de la cellule entière (whole-cell modeling).
Téléchargement
BiPON est distribuée sous la licence Creative Commons Attribution 4.0 (CC-by; https://creativecommons.org/licenses/by/4.0/) et peut être téléchargée ici.
Une ontologie jouet représentative de BiPON et permettant d'exploiter et d'explorer les règles de raisonnement automatique est disponible ici.
- BiPOm (Bacterial interlocked Process Ontology for metabolism)
Contexte
La gestion et l'organisation des connaissances biologiques demeure un défi majeur en raison de la complexité et du niveau de sophistication des systèmes vivants. Récemment, les représentations systémiques se sont révélées prometteuses pour relever ce défi à l'échelle de l'ensemble de la cellule. Dans ces représentations, la cellule est considérée comme un système composé de sous-systèmes imbriqués. La question est maintenant de développer des outils pertinents pour formaliser la description systémique des cellules.
En collaboration avec le LRI, AgroParistech et GQE, nous avons développé BiPOm, une ontologie décrivant les processus métaboliques comme des sous-systèmes imbriqués et ce, en utilisant un ensemble minimal de classes et de propriétés. Nous avons formalisé explicitement les relations entre l'enzyme, son activité, les substrats et les produits de la réaction, ainsi que l'état actif de toutes les molécules impliquées. Nous avons également montré que l'information sur les molécules telles que les types moléculaires ou les propriétés moléculaires peut être déduite à l'aide des règles SWRL et du raisonnement automatique sur les instances de BiPOm. Les informations nécessaires à l'instanciation de BiPOm peuvent être extraites de bases de données existantes ou de bio-ontologies existantes. Dans l'ensemble, il en résulte un changement de paradigme où l'ancrage des connaissances est reporté de la molécule sur le processus biologique.
Téléchargement
BiPOm est distribuée sous la licence Creative Commons Attribution 4.0 (CC-by; https://creativecommons.org/licenses/by/4.0/) et peut être téléchargée ici.
Corpus et Ontologies de l'équipe Bibliome
Les corpus et ontologies développés par l'équipe Bibliome sont décrits ici.