Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

D2KAB

Titre du projet
Data to Knowledge in Agriculture and Biodiversity
Nom de l'appel d'offre
ANR blanche
Agence de moyen
ANR
Etat
Accepté
Année de soumission
2018
Défi/axe ANR
Défi : B.7 Axe : axe 4
Equipe(s)
Bibliome
Coordinateur.trice
C. Jonquet (LIRMM, Montpellier)
Participants de MaIAGE
R. Bossy, C. Nédellec, L. Deléger
Partenaires (hors MaIAGE)
UM-LIRMM, CNRS-I3S, INRA-DIST, INRA-URGI, INRA-IATE, INRA-URFM ,IRSTEA-TSCF, CNRS-CEFE, ACTA, STANFORD-BMIR
Année de démarrage - Année de fin de projet
06/2019-11/2024
Date de fin du projet
Résumé
L'agronomie et la biodiversité doivent répondre à plusieurs grands défis sociétaux, économiques et environnementaux. Cependant, les données sont produites en si grande quantité et si vite qu'elles remettent en question notre capacité à les transformer en connaissances et permettre, par exemple, l’agriculture translationnelle, c.-à-d. le transfert rapide et efficace des résultats de recherche agronomique vers le monde agricole.

D2KAB ambitionne de mettre en place les processus permettant de transformer les données d’agronomie et de biodiversité en connaissances – sémantiquement riches, interopérables, ouvertes – ainsi que les méthodes scientifiques et les outils pour exploiter et diffuser ces connaissances. Pour ce faire, nous développerons de nouvelles approches et algorithmes pour répondre aux spécificités de nos domaines d'intérêt, mais nous nous appuierons également sur les outils et méthodes existants.

D2KAB réunit un consortium pluridisciplinaire (et international) de trois laboratoires d’informatique (UM-LIRMM, CNRS-I3S, STANFORD-BMIR), quatre laboratoires d’informatique appliquée en agronomie ou agriculture (INRA-URGI, INRA-MaIAGE, INRA-IATE, IRSTEA-TSCF), deux en écologie et ecosystemes (CNRS-CEFE, INRA-URFM), l’unité INRA d’appui à information scientifique et technique (INRA-DIST) et une association du monde agricole (ACTA). L'expertise du consortium en informatique s'étend des ontologies et métadonnées, au Web sémantique, aux données liées, à l’alignement d’ontologies, au raisonnement et l’extraction de connaissances, au traitement du langage naturel ainsi qu’à la bioinformatique.

Le projet est structuré en trois work-packages de recherche et développement en informatique et deux work-packages de scénarios. Le WP1 se concentrera sur les ontologies/vocabulaires et transformera le prototype AgroPortal en plateforme de référence répondant aux besoins de la communauté en proposant des ressources et des services de très haute qualité: conformité au format SKOS, recherche sémantique de données liées, annotation de texte, interopérabilité avec d’autres portails sémantique. Le WP2 se concentrera sur le problème majeur de l'alignement d’ontologies et développera de nouvelles fonctionnalités et algorithmes dans AgroPortal en utilisant des méthodes à base de background knowledge validées en ag & biodiv. Partant des données hétérogènes fournies par les scénarios, le WP3 déploiera les méthodes et moyens nécessaires à la construction d'un graphe distribué de connaissances ag & biodiv, et à son exploitation via des modes innovants de visualisation, navigation et recherche.

Le WP4 comprend quatre scénarios de recherche interdisciplinaire d'agriculture translationnelle. Par exemple, un système d'aide à la décision basé sur les ontologies pour sélectionner l'emballage alimentaire le plus approprié ou un lecteur sémantique augmenté pour les Bulletins de Santé du Végétal. Nous fournirons une base de connaissances scientifiques unique pour les phénotypes du blé et offrirons la première ressource de données agricoles renforcée par les données ouvertes et liées. Le WP5 développera des ressources sémantiques permettant l'annotation des données pour l’expérimentation sur les écosystèmes d’une part et pour les observations en biogéographie fonctionnelle d’autre part. Un exemple combinant des sources de données relatives à l’écologie des communautés, aux traits des plantes et aux facteurs de l’environnement sera réalisé pour comprendre les effets des changements climatiques sur la végétation du Bassin Méditerranéen.

Chacun des scénarios guidant le projet aura un impact significatif et produira des résultats concrets pour les communautés scientifiques ag & biodiv et les acteurs socio-économiques de l'agriculture. Nous avons prévu de multiples actions et événements de dissémination où nous utiliserons nos scénarios comme démonstrateurs du potentiel des technologies sémantiques en agronomie et biodiversité.