Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 


De l'extraction des connaissances au data-to-text à l'heure des modèles de langue

Organisme intervenant (ou équipe pour les séminaires internes)
AgroParisTech-INRAE, UMR 518 MIA Paris-Saclay
Nom intervenant
Vincent Guigue
Résumé

Les modèles de langues bouleversent actuellement la plupart des tâches en TAL, en particulier le domaine de l'extraction des connaissances. Les approches historiques, en IA symbolique ou statistique, souffrent d'un manque de capacité de généralisation; l'émergence du pré-apprentissage est porteur de promesse à ce niveau, comme en témoigne l'apparition conjointe de nouveaux benchmarks.

Après avoir discuté de l'état de l'art en reconnaissance d'entités nommées et plus marginalement en extraction de relations, nous envisagerons les nouvelles opportunités offertes par les modèles génératifs. Sous ce prisme, nous verrons que le data-to-text, le résumé automatique et les métriques orientées contenu sur cette tâche ou la lutte contre les hallucinations rentrent dans le cadre plus général de la modélisation des connaissances.

En conclusion, nous parlerons brièvement des approches multi-modales pour ouvrir des perspectives vers des connaissances plus précises ou plus robustes.
 

Lieu
Salle de réunion 142, bâtiment 210
Date du jour