Les modèles de langues bouleversent actuellement la plupart des tâches en TAL, en particulier le domaine de l'extraction des connaissances. Les approches historiques, en IA symbolique ou statistique, souffrent d'un manque de capacité de généralisation; l'émergence du pré-apprentissage est porteur de promesse à ce niveau, comme en témoigne l'apparition conjointe de nouveaux benchmarks.
Après avoir discuté de l'état de l'art en reconnaissance d'entités nommées et plus marginalement en extraction de relations, nous envisagerons les nouvelles opportunités offertes par les modèles génératifs. Sous ce prisme, nous verrons que le data-to-text, le résumé automatique et les métriques orientées contenu sur cette tâche ou la lutte contre les hallucinations rentrent dans le cadre plus général de la modélisation des connaissances.
En conclusion, nous parlerons brièvement des approches multi-modales pour ouvrir des perspectives vers des connaissances plus précises ou plus robustes.
Â