Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

CLEF ESV DATA CHALLENGE

Titre du projet
CLEF ESV – organisation de la tâche PHS à CLEF (Conference and Labs of the Evaluation Forum)
Etat
Accepté
Année de soumission
2024
Equipe(s)
Bibliome
LogInf
Coordinateur.trice
C. Nédellec
Participants de MaIAGE
R. Bossy, L. Deléger, C. Nédellec, V. Vidal
Partenaires (hors MaIAGE)
Plateforme ESV
Année de démarrage - Année de fin de projet
2024-2025
Date de fin du projet
Résumé
Le projet vise à proposer une tâche, dite Lab, à la compétition internationale CLEF (Conference and Labs of the Evaluation Forum) en 2024 sur les données dites EPOP (Epidemiomonitoring Of Plant) - un corpus textuel annoté.
La thématique est celle de la surveillance de bioagresseurs de plantes cultivées à travers les news internationales. La tâche consiste à extraire des mentions d’observations représentées par des événements d’interactions biologiques entre les organismes nuisibles surveillés, les plantes hôtes, et éventuellement les vecteurs, les maladies observées, ceci en un lieu et à une date donnée.
Le corpus EPOP, corpus de référence, a été annoté manuellement par plus de 30 experts des espèces considérées : les entités du texte et leurs relations sont annotées sémantiquement par les référentiels du domaine (taxonomie et référentiel géographique). Le corpus sera exploité dans la tâche de la compétition pour entraîner et évaluer les méthodes de Traitement Automatiques de la Langue (TAL). L’objectif scientifique est double, assister la veille sanitaire et scientifique par des méthodes automatiques, et proposer à la communauté BioNLP (Natural Language Processing for Biology) un nouveau corpus de référence comprenant des relations biologiques et spatio-temporelles dans le domaine des plantes, domaine mal doté en corpus annotés.
Le projet implique principalement le laboratoire MaIAGE et la Plateforme d’Épidémiosurveillance en Santé Végétale (Plateforme ESV). Le soutien financier permettrait de préparer les éléments constitutifs d’un Lab à CLEF selon trois volets complémentaires : (1) échantillonnage des données et métriques d’évaluation (2) réalisation du site web avec son espace participants (3) missions aux conférences CLEF en 2024 et 2025.