Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

Nédellec Claire

 

Address

  Email : claire.nedellec@jouy.inra.fr
Adresse : INRA - Unité MaIAGE
                 Bâtiment 233
                 Domaine de Vilvert
                 78352 JOUY-EN-JOSAS CEDEX
Tél : +33 (0)1 34 65 28 78
Fax : +33 (0)1 34 65 00 00
Secrétariat : +33 (0)1 34 65 28 86

Cursus                                                                                                                  


Claire Nédellec is research director at INRAE, leader of Bibliome team.

She has been researcher at LRI, Université Paris-Sud from 1994 to 2001 after a PhD in Inductive Logic Programming applied to cooperative machine learning. She has obtained her HDR 2013. She joined the MaIAGE unit in 2001 where she created the Bibliome team. 


Research interests


Machine Learning and Natural Language Processing for Information Extraction and Ontology building.
Open Science and text mining
Application to scientific and technical domains, Life Science

Projects


On-going projects

HoloOligo - Structure diversity, functionality and modulation of milk oligosaccharides in monogastric livestock species: towards optimal development of rabbit and pig holobionts (2022-2024)

TyDI - Terminology Design Interface (2021-2022)

BEYOND  ANR PPR Cultiver et protéger autrement.-  Building epidemiological surveillance and prophylaxis with observations both near and distant (2021-2025).

TIERS-ESV  Traitement de l’Information et Expertise des Risques Sanitaires pour l’Epidémiosurveillance en Santé Végétal - IB2021 Départements INRAE MathNum et SPE (2021-2022).

D2KAB  Data to Knowledge in Agriculture and Biodiversity - ANR (2019-2023).

 

Recent projects

OntoBedding  Amélioration de plongements lexicaux par des ontologies pour leur adaptation aux domaines de spécialité DIM IdF RFSI, sept STIC Université Paris-Saclay (2019).

ENovFood  Linking a phenotypic and a network food microbe data bases: an application for food microbial ecology and food innovation Métaprogramme MEM (2018-2020).

Visa TM  - BSN, CoSO  Vers une infrastructure de services avancés pour le text mining (2017-2018)

OpenMinTeD H2020 Open Mining Infrastructure for Text and Data (2015-2018)

D-ONT, Exploitation optimisée des bases de données phénotypiques - Des ontologies pour le partage d’information, ACI Phase 2016-2018.

Florilege  - A database gathering microbial phenotypes of food interest. Métaprogramme MEM  - Action ciblée  (2016-2018)

OntoBiotope : Métaprogramme INRA MEM (Métagénomique des écosystèmes microbiens). (2012-2013).

Quaero : Automatic multimedia content processing Oséo. (2008-2013).

FSOV SAM Blé : Sélection du blé tendre assistée par marqueur Fond de soutien à l'obtention végétale (2010-2013).


Animation


Co-animation du GT D2K - De la Donnée à la Connaissance.Labex DigiCosme

Co-animation du thème IID-1 Data Management, knowledge representation and reasoning du LabEx DigiCosme. Membre de la commission Recherche.

Institut de Convergence DataIA, Université Paris-Saclay. Membre du bureau. 

Organisation de challenges internationaux en extraction d'information : Genic Interaction Extraction Challenge at LLL'05 (Learning Language in Logic), BioNLP Shared Task (2011, 2013, 2016) puis BioNLP Open Shared Task : 2019


Supervision


On going supervision

Mariya Borovikova, " Information extraction from textual data for epidemiosurveillance for plant health" Thèse en préparation. Université Paris-Saclay, projet ANR Beyond. co-supervision Mathieu Roche (Tetis), Arnaud Ferré, Robert Bossy (MaIAGE). 

Anfu Tang, Extraction d'informations relationnelles à partir de textes en domaine spécialisé - adaptabilité et passage à l'échelle. Thèse en préparation. Université Paris-Saclay DigiCosme, co-supervision Pierre Zweigenbaum (LIMSI) et Louise Deléger (MaIAGE). 

 

Recent supervision

Estelle Chaix, post-doc, OpenMinTeD project, Visa TM project.

 Arnaud Ferré, Représentations vectorielles et apprentissage automatique pour l’alignement d’entités textuelles et de concepts d’ontologie : application à la biologie. Thèse soutenue le 24-05-2019. Université Paris-Saclay IDI, co-supervision with Pierre Zweigenbaum (LIMSI). Projet OntoBedding post-doc.

 Mouhamadou Ba, post-doc, OpenMinTeD project, Visa TM project.

 Zorana Ratkovic Predicative Analysis for Information Extraction : application to the biology domain. Co-supervision Thierry Poibeau, Univ Paris 3. Thèse soutenue le 11/12/2014. 

 Dialekti Valsamou, Extraction d’Information pour les réseaux de régulation de la graine chez Arabidopsis Thaliana. Thèse soutenue le 17-01-17. Université Paris-Saclay IDI, co-supervision with Pierre Zweigenbaum (LIMSI).


Publications


Recent publications

Journal

  • Jin-Dong Kim, Robert Bossy, Louise Deleger, Claire Nédellec, Martin Krallinger and Kevin Bretonnel Cohen. Recent Progresses with BioNLP Open Shared Tasks - Part 1. BMC Bioinformatics, Volume 21 Supplement 23, Hong Kong, China November 2019. 

  • Ferré, A., Deléger, L., Bossy, R., Zweigenbaum, P., Nédellec, C.,. C-Norm: a neural approach to few-shot entity normalization. BMC Bioinformatics 21, 579 (2020). https://doi.org/10.1186/s12859-020-03886-8

  • Claire Nédellec, Liliana Ibanescu, Robert Bossy, Pierre Sourdille. WTO, an ontology for wheat traits and phenotypes in scientific publications. 18(2) Genomics & Informatics. juin 2020. doi: 10.5808/GI.2020.18.2.e14

  •  Estelle Chaix, Louise Deléger, Robert Bossy, Claire Nédellec "Text mining tools for extracting information about microbial biodiversity in food" Food Microbiology, 2019. https://doi.org/10.1016/j.fm.2018.04.011
    http://www.sciencedirect.com/science/article/pii/S0740002017310638

  • Agnès Girard et le réseau des documentalistes du Département Phase, Inra Rennes et Claire Nédellec et l’équipe de recherche BibliomeTriphase : co-construction d’une ressource termino-ontologique. Arabesque, 2016. https://publications-prairial.fr/arabesques/index.php?id=648

  • Robert Bossy, Wiktoria Golik, Zorana Ratkovic, Dialekti Valsamou, Philippe Bessières, Claire Nédellec. An Overview of the  Gene Regulation Network and the Bacteria Biotope Tasks in BioNLP’13. BMC Bioinformatics, Vol 16 Suppl 10, 2015.

International conference

  • Anfu Tang, Louise Deléger, Robert Bossy, Pierre Zweigenbaum, Claire Nédellec. Does constituency analysis enhance domain-specific pre-trained BERT models for relation extraction? Proceedings of the BioCreative VII Challenge Evaluation Workshop, 8-10 Feb. 2021. ISBN: 978-0-578-32368-8
  •  
  • Arnaud Ferré, Robert Bossy, Mouhamadou Ba, Louise Deléger, Thomas Lavergne, Pierre Zweigenbaum, Claire Nédellec. Handling Entity Normalization with no Annotated Corpus: Weakly Supervised Methods Based on Distributional Representation and Ontological Information, Proceedings of The 12th international conference on Language Resources and Evaluation (LREC-2020), pages 1959–1966. European Language Resources Association (ELRA) publisher, mai 2020. https://www.aclweb.org/anthology/2020.lrec-1.241/
  • Robert Bossy, Louise Deléger, Estelle Chaix, Mouhamadou Ba, Claire Nédellec. Bacteria Biotope at BioNLP Open Shared Tasks 2019, Proceedings of the 5th Workshop on BioNLP Open Shared Tasks joint to EMNLP-IJCNLP 2019, Hong-Kong, nov 2019. doi 10.18653/v1/D19-5719 https://www.aclweb.org/anthology/D19-5719/

  • Arnaud Ferré, Louise Deléger, Pierre Zweigenbaum, Claire Nédellec. Combining rule-based and embedding-based approaches to normalize textual entities with an ontology, The 11th edition of Language Resources and Evaluation Conference (LREC-2018), European Language Resources Association (ELRA) publisher, Miyazaki, mai 2018. http://www.lrec-conf.org/proceedings/lrec2018/pdf/446.pdf

  • Nédellec C., Bossy R., Chaix E., Deléger L. Text-mining and ontologies: new approaches to knowledge discovery of microbial diversity. In Proceedings of the 4th International Microbial Diversity Conference. pp. 221-227, ed. Marco Gobetti. Pub. Simtra. ISBN 978-88-943010-0-7, arXiv:1805.04107, Bari, October 2017.

  • Estelle Chaix, Sophie Aubin, Louise Deléger, and Claire Nédellec. Text-mining needs of the food microbiology research community, In Ovive workshop joint to European Federation for Information Technology in Agriculture, Food and the Environment (EFITA) conference. Montpellier, 12 pages, juillet 2017.https://www.fosteropenscience.eu/sites/default/files/pdf/3437.pdf

  • Arnaud Ferré, Pierre Zweigenbaum, Claire Nédellec, Representation of complex terms in a vector space structured by an ontology for a normalization task. In Proceedings of the BioNLP 2017 Workshop, Association for Computational Linguistics, Vancouver, 8 pages, Canada 2017.https://www.aclweb.org/anthology/W17-2312.pdf
  • Estelle Chaix, Bertrand Dubreucq, Abdelhak Fatihi, Dialekti Valsamou, Robert Bossy, Mouhamadou Ba, Louise Deléger, Pierre Zweigenbaum, Philippe Bessières, Loïc Lepiniec, Claire Nédellec. Overview of the Regulatory Network of Plant Seed Development (SeeDev) Task at the BioNLP Shared Task.  In Proceedings of the BioNLP Shared Task 2016 Workshop, Association for Computational Linguistics, Berlin, Germany 2016. 10.18653/v1/W16-3001
  • Louise Deléger, Robert Bossy, Estelle Chaix, Mouhamadou Ba, Arnaud Ferré, Philippe Bessières, Claire Nédellec, Overview of the Bacteria Biotope Task at BioNLP Shared Task,  In Proceedings of the BioNLP Shared Task 2016 Workshop, Association for Computational Linguistics, Berlin, Germany 2016.http://www.aclweb.org/anthology/W16-3002

Book chapter

  • Nédellec  C ., "Introduction au chapitre V, Web, réseaux sociaux et recherche d’information" dans Les Big Data à découvert, sous la direction de Mokrane Bouzeghoub et Rémy Mosseri, CNRS Éditions, 16 mars 2017.

  • Nédellec C., Nazarenko A., Bossy R. "Information Extraction", Handbook on Ontology., S. Staab, R. Studer (eds.), Springer Verlag, 2009.

Publications at INRAE

Complete list of publications