Contexte :
Les techniques d'extraction d'information (text-mining) récentes les plus performantes reposent sur de l'apprentissage automatique supervisé. Or, l’évaluation et l’entraînement de ces méthodes nécessitent une phase d’annotation humaine laborieuse. Cela est particulièrement vrai pour les domaines spécialisés, tels que la microbiologie, où la production et la validation des annotations nécessitent l'intervention d'experts, et où les données produites sont d’un grand intérêt [Deléger2016]. La Réalité Virtuelle (RV) et par extension la Réalité Étendue (XR) permettent d’améliorer les performances d’utilisateurs ainsi que leur engagement lors de la réalisation de tâches spécifiques comme de la rééducation ou de l’apprentissage humain [David2017, Mayer2023].
Projet :
Nous proposons dans ce stage de développer et d’évaluer un outil d'annotation textuelle immersif en Réalité Virtuelle (RV) similaire à VAnnotator [Spiekermann2018] pouvant tirer parti des possibilités d’annotation en Réalité Étendue (XR) [Borhani2023]. La tâche d’annotation spécifique visée sera la reconnaissance d'entités. Cette dernière consiste à identifier et classifier des entités nommées dans un texte (ex : identifier dans la phrase suivante que la mention “Escherichia coli” est une bactérie - “Escherichia coli est trouvée dans les intestins des animaux”). L’accent sera mis sur la mise en place de l’annotateur immersif ainsi que de son évaluation comparée avec les outils existants.
Missions :
- Revue de la littérature des solutions d’annotation immersives.
- Transfert de données textuelles issues d’un corpus BB4 pour la reconnaissance d’entités et développé à MaIAGE dans un casque de RV.
- Installation et configuration d’un annotateur standard [Colucci2024] dans un environnement immersif, pour la visualisation des données, le développement de fonctionnalités et pour améliorer l’annotation en RV.
- Mise en place d’expérimentations utilisateurs pour comparer l’utilisation immersive et non-immersive (cybersickness, utilisabilité, etc.).
- Rédaction du manuscrit pour diffusion et documentation.
Le stage pourra être l’occasion de préparer un poster pour une conférence des domaines concernés (ex : IHM, TALN).
Compétences :
Formations visées : informatique (IHM, IA, etc.) ou équivalent.
- Compétences en développement informatique (préférentiellement web, Python et Android)
- Compétences en IHM (évaluation de l’expérience utilisateur, analyse d’applications interactives)
- Une expérience en développement XR serait un plus
- Capacité de travail en autonomie
- Un attrait pour la recherche scientifique
Lieu : laboratoire MaIAGE, centre INRAE de Jouy-en-Josas (78)