Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

SADAT Sofiane

Type
Sujet
Generative AI and Large Language Models for biological sequence characterization
Date de début
Date de fin
Encadrant(s)
Arnaud FERRE, Guillaume KON KAM KING, Sofia LOTFI
Description/résumé

Les activités et responsabilités de ce stage sont :

  • Travailler en étroite collaboration avec notre équipe de chercheurs (experts en IA et en biologie) pour comprendre les enjeux et les besoins liés au design de séquences biologiques, notamment des antisense oligonucléotides et de l’ARN messager et pré-messager. 

  • Explorer et adapter des algorithmes d’IA génératives dont des LLM de grande envergure pour traiter des données multi-omiques et structurales, dont des données génomiques et transcriptomiques.

  • Développer et mettre en œuvre des algorithmes et des pipelines de traitement de données standardisées pour appliquer ces modèles et exposer des résultats scientifiquement afin de réaliser des validations expérimentales

  • Documenter les méthodes déployées, les résultats et les analyses réalisées, et présenter régulièrement les progrès à l'équipe de recherche.

Année de soutenance (pour les thèses ou les stages)
2024
Ecole/université (pour les thèses et les stages)
ENSIMAG
Niveau/diplôme (pour les stages)
M2