Intitulé du projet
AI for publication KnOwledge
Nature du financement
PEPR
État du projet
Accepté
Année de soumission
2024
Programme / appel + année
PEPR 2026
Equipe(s) impliquée(s) dans le projet
Bibliome
Coordinateur·trice (nom et prénom)
Roche Mathieu
Rôle de MaIAGE dans le projet
Responsable de Work Package
Partenaire (projet multipartenaires)
Nom(s) du(des) participant(s) - MaIAGE
L. Deléger, A. Ferré
Nom(s) du(des) partenaire(s) (nom, labo et localisation) - Hors MaIAGE
O. Ferret - CEA
Date de début du projet
Date de fin du projet
Résumé
Le programme AIKO vise à développer une infrastructure souveraine d’IA pour l’analyse approfondie des publications scientifiques. Il articule quatre défis scientifiques centrés sur l’extraction, la structuration, l’enrichissement et la valorisation des connaissances issues des textes, figures et données scientifiques. Le projet combine des travaux méthodologiques en IA, TAL et approches multimodales avec une forte intégration aux infrastructures de recherche existantes. AIKO promeut la science ouverte, fondée sur l’accès libre aux données, modèles et logiciels, avec une attention particulière aux enjeux de propriété intellectuelle. Il s’appuie sur des campagnes expérimentales, formations et hackathons pour fédérer la communauté.
MaIAGE intervient comme co-coordinateur du défi 1, et comme co-coordinateur de la tâche 1.1 (demi-financement d'une thèse environnée, thèse qui sera co-encadrée par L. Deléger et A. Ferré)
Défi 1 : Reconnaissance et identification de l’information dans les publications scientifiques
Le défi 1 vise à développer des méthodes d’IA pour identifier, extraire et structurer automatiquement l’information scientifique contenue dans les publications. Il s’intéresse à la reconnaissance fine des concepts, entités, relations et références, au-delà des simples métadonnées. L’objectif est de mieux comprendre le contenu scientifique, de faciliter la navigation dans la littérature et d’alimenter des graphes de connaissances fiables et réutilisables.
Tâche 1.1 : Extraction et liage d’informations sémantiques à partir des textes
La tâche 1.1 consiste à extraire des entités (concepts, objets, méthodes, etc.) et les relations qui les lient à partir du texte des publications scientifiques, puis à les relier à des bases de connaissances existantes. Elle s’inscrit dans une approche de population automatique de bases de connaissances adaptée aux écrits scientifiques, avec la possibilité d’enrichir les référentiels lorsque de nouvelles connaissances sont identifiées.
MaIAGE intervient comme co-coordinateur du défi 1, et comme co-coordinateur de la tâche 1.1 (demi-financement d'une thèse environnée, thèse qui sera co-encadrée par L. Deléger et A. Ferré)
Défi 1 : Reconnaissance et identification de l’information dans les publications scientifiques
Le défi 1 vise à développer des méthodes d’IA pour identifier, extraire et structurer automatiquement l’information scientifique contenue dans les publications. Il s’intéresse à la reconnaissance fine des concepts, entités, relations et références, au-delà des simples métadonnées. L’objectif est de mieux comprendre le contenu scientifique, de faciliter la navigation dans la littérature et d’alimenter des graphes de connaissances fiables et réutilisables.
Tâche 1.1 : Extraction et liage d’informations sémantiques à partir des textes
La tâche 1.1 consiste à extraire des entités (concepts, objets, méthodes, etc.) et les relations qui les lient à partir du texte des publications scientifiques, puis à les relier à des bases de connaissances existantes. Elle s’inscrit dans une approche de population automatique de bases de connaissances adaptée aux écrits scientifiques, avec la possibilité d’enrichir les référentiels lorsque de nouvelles connaissances sont identifiées.
Champ thématique du contrat (MathNum)
Grand objectif concerné - principal - (MathNum)
Ce projet s'inscrit-il dans le périmètre scientifique du département MathNum ?