Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

EXONCOD

Equipe(s)
Titre du projet
EXtraction d’informations ONCOlogiques à partir de Documents
Nom de l'appel d'offre
n.a. (financement via partenaire)
Défi/axe ANR
n.a.
Coordinateur.trice
Arnaud Ferré
Participants de MaIAGE
L. Deléger, R. Bossy, A. Ferré
Partenaires (hors MaIAGE)
LISN (Orsay), CAIMAN MEDICAL (Paris)
Année de démarrage - Année de fin de projet
2023-2025
Date de fin du projet
Résumé
Les médecins nucléaires perdent un temps important à produire les comptes-rendus pour le suivi de patients avec une présomption de cancer, car ils doivent parcourir des images 3D volumineuses ainsi que de nombreux documents cliniques. Un outil d’extraction d’information efficace sur la langue française clinique permettrait de guider et d’accélérer les médecins dans ces suivis. La question de recherche est d’étudier des stratégies d’adaptation en domaine spécialisé en se servant de ressources externes à disposition (ex : corpus ou bases de connaissances en langue française, ou non) pour améliorer les performances de méthodes dédiées à l’étape de reconnaissance d’entité, tâche centrale en extraction d'information, et en contexte de zero-shot learning (c.-à.-d. sans donnée d'entraînement). Pour évaluer la pertinence de ces stratégies, d’autres jeux de données standards du domaine biologique (ex : Bacteria Biotope) et biomédical (ex : CAS, QUAERO) pourront être utilisés.
L'entreprise CAIMAN MEDICAL financera un contrat postdoctoral de 18 mois, partagé équitablement entre le LISN et MaIAGE, ainsi que les dépenses associées (matériel, publication, conférence, missions, ...). Le projet pourrait débuter par une phase de recrutement avant la fin de l'année, mais reste dépendant de l'accord CNIL en cours quant à l'utilisation de données cliniques pseudonymisées par les différents partenaires.
Année de soumission
2023