Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

Nédellec Claire

Coordonnées

 Email : claire.nedellec@inrae.fr
Adresse : INRAE - Unité MaIAGE
                 Bâtiment 233
                 Domaine de Vilvert
                 78352 JOUY-EN-JOSAS CEDEX
Tél : +33 (0)1 34 65 28 78
Fax : +33 (0)1 34 65 00 00
Secrétariat : +33 (0)1 34 65 28 86

Cursus                                                                                                                  


Claire Nédellec est directrice de recherche en informatique à INRAE depuis 2001. Elle anime l'équipe Bibliome.

Elle a été maître de conférence en informatique au LRI, Université Paris-Sud de 1994 à 2001 après avoir obtenu sa thèse en programmation logique inductive appliquée à l'apprentissage automatique coopératif sous la direction d'Yves Kodratoff. Elle a rejoint l'unité MaIAGE en 2001 où elle a créé l'équipe Bibliome qu'elle anime. Elle a obtenu son HDR en 2013.


Sujets de recherche


Apprentissage automatique et traitement automatique de la langue pour l'extraction d'information à partir de textes et pour l'acquisition d'ontologie.
Services ouverts de text mining
Application aux domaines scientifiques et techniques, notamment en sciences du vivant

Projets


Projets de recherche en cours

FAIROmics H2020 -  FAIRification of multiOmics data to link databases and create knowledge graphs for fermented foods (2024-2027)

HoloOligo ANR - Structure diversity, functionality and modulation of milk oligosaccharides in monogastric livestock species: towards optimal development of rabbit and pig holobionts (2022-2025)

TyDI - Terminology Design Interface (2021-2025)

BEYOND  ANR PPR Cultiver et protéger autrement.-  Building epidemiological surveillance and prophylaxis with observations both near and distant (2021-2025).

D2KAB  Data to Knowledge in Agriculture and Biodiversity - ANR (2019-2024).

Projets récents

TIERS-ESV  Traitement de l’Information et Expertise des Risques Sanitaires pour l’Epidémiosurveillance en Santé Végétal - IB2021 Départements INRAE MathNum et SPE (2021-2023).

OntoBedding  Amélioration de plongements lexicaux par des ontologies pour leur adaptation aux domaines de spécialité DIM IdF RFSI, sept STIC Université Paris-Saclay (2019).

ENovFood  Linking a phenotypic and a network food microbe data bases: an application for food microbial ecology and food innovation Métaprogramme MEM (2018-2020).

Visa TM  - BSN, CoSO  Vers une infrastructure de services avancés pour le text mining (2017-2018)

OpenMinTeD H2020 Open Mining Infrastructure for Text and Data (2015-2018)

D-ONT, Exploitation optimisée des bases de données phénotypiques - Des ontologies pour le partage d’information, ACI Phase 2016-2018.

Florilege  - A database gathering microbial phenotypes of food interestMétaprogramme MEM  - Action ciblée  (2016-2018)

OntoBiotope : Métaprogramme INRA MEM (Métagénomique des écosystèmes microbiens). (2012-2013).

Quaero : Automatic multimedia content processing Oséo, BPI France. (2008-2013).

FSOV SAM Blé : Sélection du blé tendre assistée par marqueur Fond de soutien à l'obtention végétale (2010-2013).


Animation


Co-animation du GT D2K - De la Donnée à la Connaissance.Labex DigiCosme

Conseils scientifiques du département INRAE MathNum et de la Graduate School ISN (Université Paris-Saclay). Membre des commissions Recherche et Enseignement. Correspondants de la GS au comité de pilotage de la science ouverte

Institut d'Intelligence Artificielle DataIA, Université Paris-Saclay. Membre du bureau. 

Organisation de challenges internationaux en extraction d'information : Genic Interaction Extraction Challenge at LLL'05 (Learning Language in Logic), BioNLP Shared Task (2011, 2013, 2016) puis BioNLP Open Shared Task : 2019


Encadrement


Encadrements en cours

Myriam Dulor, Définir et évaluer des critères bibliographiques, linguistiques et biologiques de pertinence d’information sur les insectes vecteurs de maladies de plante dans une perspective historique, stage. Co-supervision avec Nicolas Sauvion et Robert Bossy.
 
Mariya Borovikova, " Information extraction from textual data for epidemiosurveillance for plant health" Thèse en préparation. Université Paris-Saclay, projet ANR Beyond. co-supervision Mathieu Roche (Tetis), Arnaud Ferré, Robert Bossy (MaIAGE). 
 

Encadrements récents

Catalina Garcia, ingénieur, projet TIERS-ESV.

 

Anfu Tang, Exploitation de l’information linguistique et sémantique pour l’extraction de relations à partir de textes en domaine spécialisé, Thèse soutenue le 8/12/2023. Université Paris-Saclay, co-supervision avec Pierre Zweigenbaum (LISN) et Louise Deléger (MaIAGE).

 

Clara Sauvion, ingénieur, projets TIERS-ESV et D2KAB.

 

Estelle Chaix, post-doc, OpenMinTeD project, Visa TM project.

 

 Arnaud Ferré, Représentations vectorielles et apprentissage automatique pour l’alignement d’entités textuelles et de concepts d’ontologie : application à la biologie. Thèse soutenue le 24-05-2019. Université Paris-Saclay IDI, co-supervision avec Pierre Zweigenbaum (LIMSI). Projet OntoBedding post-doc.

 

 Mouhamadou Ba, post-doc, OpenMinTeD project, Visa TM project.


Publications


Publications récentes

Journal

  • Mathilde Rumeau, François Fenaille, Agnès Girard, Valentin Loux, Mouhamadou Ba, Claire Nédellec, Louise Deléger, Robert Bossy, Sophie Aubin, Christelle Knudsen, Sylvie Combes. (2024) MilkOligoThesaurus, A mammalian milk oligosaccharide thesaurus for automatic annotation and text data mining of scientific articles: a dataset of synonyms from the scientific literature. Data in Brief. 2024, 110404, ISSN 2352-3409, https://doi.org/10.1016/j.dib.2024.110404.

  • Cindy E. Morris, Andrea Radici, Christine N. Meynard, Nicolas Sauvion, Claire Nédellec, et al.. More than food: Why restoring the cycle of organic matter in sustainable plant production is essential for the One Health nexus. CAB Reviews Perspectives in Agriculture Veterinary Science Nutrition and Natural Resources, 2024, 19, pp.1. 10.1079/cabireviews.2024.0008. hal-04524528

  • Dérozier S, Bossy R, Deléger L, Ba M, Chaix E, Harlé O, Loux V., Falentin H., Nédellec C. (2023) Omnicrobe, an open-access database of microbial habitats and phenotypes using a comprehensive text mining and data fusion approach. PLoS ONE 18(1): e0272473. https://doi.org/10.1371/journal.pone.0272473. 

  • Anfu Tang, Louise Deléger, Robert Bossy, Pierre Zweigenbaum, Claire Nédellec. (2022) Do syntactic trees enhance domain-specific BERT models for relation extraction? Database, Volume 2022. https://doi.org/10.1093/database/baac070.

  • Morris, C.E., Géniaux, G., Nédellec, C., Sauvion, N. & Soubeyrand, S. (2021) One Health concepts and challenges for surveillance, forecasting, and mitigation of plant disease beyond the traditional scope of crop production. Plant Pathology, 00, 1– 12. https://doi.org/10.1111/ppa.13446

  • Ferré, A., Deléger, L., Bossy, R., Zweigenbaum, P., Nédellec, C., (2020). C-Norm: a neural approach to few-shot entity normalization. BMC Bioinformatics 21579 https://doi.org/10.1186/s12859-020-03886-8

  • Claire Nédellec, Liliana Ibanescu, Robert Bossy, Pierre Sourdille (2020)WTO, an ontology for wheat traits and phenotypes in scientific publications. 18(2) Genomics & Informatics. juin 2020. doi: 10.5808/GI.2020.18.2.e14

  • Ferré, A., Deléger, L., Bossy, R., Zweigenbaum, P., Nédellec, C.,. C-Norm: a neural approach to few-shot entity normalization. BMC Bioinformatics 21, 579 (2020). https://doi.org/10.1186/s12859-020-03886-8

Colloque international

  • Tang. A. Bossy R., Nédellec C., Deléger L. Exploiting Graph Embeddings from Knowledge Bases for Neural Biomedical Relation Extraction. In proceedings of the 29th Annual International Conference on Natural Language & Information Systems (NLDB 2024), Torino, Italy, June 2024. 

  • Mariya Borovikova, Arnaud Ferré, Robert Bossy, Mathieu Roche and Claire Nédellec. Semantically-Informed Domain Adaptation for Named Entity Recognition. ISMIS-2024 (International Symposium on Methodologies for Intelligent Systems), Poitiers, 2024.

  • Mariya Borovikova, Arnaud Ferré, Robert Bossy, Mathieu Roche, Claire Nédellec. Could keyword masking strategy improve language model? In: Proceedings of the 28th International Conference on Natural Language & Information Systems (NLDB 2023), Métais, E., Meziane, F., Sugumaran, V., Manning, W., Reiff-Marganiec, S. (eds). Lecture Notes in Computer Science, vol 13913. Springer, Cham. University of Derby, United Kingdom, 21-23 June 2023. https://doi.org/10.1007/978-3-031-35320-8_19

  • Arnaud Ferré, Robert Bossy, Mouhamadou Ba, Louise Deléger, Thomas Lavergne, Pierre Zweigenbaum, Claire Nédellec. Handling Entity Normalization with no Annotated Corpus: Weakly Supervised Methods Based on Distributional Representation and Ontological Information, Proceedings of the 12th international conference on Language Resources and Evaluation (LREC-2020), pages 1959–1966. European Language Resources Association (ELRA) publisher, mai 2020. https://www.aclweb.org/anthology/2020.lrec-1.241/

Liste complète sur GoogleScholar

Full list of publications on HAL