Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

SUN Yaxin

Type
Stagiaire
Sujet
Vers un Biocontrôle Efficace : Extraction Automatique des Résultats expérimentaux de la littérature scientifique Towards Effective Biocontrol: Automatic Extraction of Experimental Results from Scientific Literature
Date de début
Date de fin
Encadrant(s)
Claire Nédellec, Robert Bossy, Thomas Presseq (Syndev)
Equipe(s)
Bibliome
Contrat de recherche
Contrat de partenariat SYNDEV. Outil d'Aide à la Décision pour Favoriser l’usage et le Succès de Biosolutions pour la Santé des Plantes.
Année de soutenance (pour les thèses ou les stages)
2026
Ecole/université (pour les thèses et les stages)
Faculté des langues, Université de Strasbourg
Niveau/diplôme (pour les stages)
Master 2
Description/résumé

Ce stage s’inscrit dans le projet OAD Succes - Outil d'Aide à la Décision pour Favoriser l’usage et le Succès de Biosolutions pour la Santé des Plantes.
Les produits de biocontrôle sont des produits d’origine naturelle développés pour diminuer et remplacer les pesticides de synthèse pour des cultures plus respectueuses de l’environnement. Au-delà de leur formulation, les conditions d’applications (dose, fréquence, mode d’administration) et les facteurs environnementaux (humidité, température) jouent un rôle déterminant dans l’efficacité des traitements dans la lutte contre les pathogènes des plantes cultivées et en conséquence dans l’adoption de technologies de biocontrôle par les agriculteurs.
Les données expérimentales des essais sont rapportées dans la littérature scientifiques et des rapports sous des formes diverses, textes libres, figures ou tableaux. L’objectif de ce stage est le développement de méthodes d’extraction automatique d’information à partir de textes basées sur l’apprentissage automatique (machine learning) pour enrichir la base de connaissance sur le biocontrôle afin de contribuer à l’application d’accompagnement des agriculteurs développée par la société SYNDEV.
Les méthodes mises en œuvre par le stagiaire devront tirer parti d’un ensemble restreint d’exemples annotés manuellement, ainsi que des ressources expertes déjà disponibles. L’enjeu est de concevoir des approches efficaces même en contexte de données limitées, tout en assurant la qualité et la fiabilité des informations extraites. Les modèles de langue seront évalués en comparaison avec les informations extraites manuellement. Les conclusions du stage incluront une analyse des verrous et des solutions prometteuses.