Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

 

Cloud4sams

Titre du projet
Espaces numériques sécurisés pour l'accès et l’analyse des données du PEPR Systèmes Alimentaires, Microbiome et Santé
Nom de l'appel d'offre
PEPR SAMS
Agence de moyen
PEPR
Etat
Accepté
Année de soumission
2023
Equipe(s)
Migale
StatInfOmics
Coordinateur.trice
Nicolas Pons et Claudine Médigue
Participants de MaIAGE
H. Chiapello, V. Loux, G. Gautreau
Partenaires (hors MaIAGE)
Université de Nantes, Université Claude Bernard Lyon1, Université Clermont Auvergne, CNRS, INRAE, INSERM, INRIA, IRD
Année de démarrage - Année de fin de projet
09/2024-08/2029
Date de fin du projet
Résumé
L’analyse de l’impact du microbiome humain sur la santé représente un enjeu scientifique et médical, et pose des défis aussi bien sur le plan technologique (données massives, dispersées, hétérogènes) qu’éthique (données identifiantes et à valeur prédictive pour la santé et le mode de vie). Le PEPR Systèmes Alimentaires, Microbiome et Santé finance un ambitieux programme visant à stimuler l’analyse du microbiome en France via des appels à projets ciblés ou ouverts, dont les résultats ont vocation à être Faciles à trouver, Accessibles, Interopérables et Réutilisables (principes FAIR).
Le projet ciblé Cloud4SAMS vise à déployer une infrastructure numérique distribuée permettant aux chercheurs d’exploiter les données de microbiome et de santé dans un environnement informatique sécurisé. Il s’appuie sur la fédération de ressources informatiques opérées par différentes institutions et réparties sur différents sites : jeux de données produits par des projets de microbiome (notamment ceux qui seront financés par le PEPR SAMS), outils logiciels et workflows pour le traitement de ces données, plateformes de calcul et stockage appropriées au traitement des données de microbiome et à leur appariement avec des données de santé. Ces ressources seront indexées dans le catalogue Cloud4SAMS (WP2), et serviront de briques de base pour définir des recettes de déploiement décrivant l’ensemble des procédures pour instancier une machine virtuelle dans un cloud sécurisé (WP3), pour y installer tout l’environnement logiciel et pour y accueillir les jeux de données nécessaires au projet. L’accès à ces données (WP4) est facilité par une interface qui gère les demandes auprès des comités d’accès de chaque projet, la validation des autorisations, l’extraction ad hoc des données et leur transfert vers les espaces sécurisés.
Le projet comporte un volet important consacré à la dissémination et à la formation (WP5) : appui aux producteurs de données pour l’évaluation de la qualité des données, l’amélioration des métadonnées, et la soumission aux entrepôts de référence; formation des usagers aux ressources informatiques (catalogue, portail d’accès, environnements sécurisés) mais aussi aux questions éthiques et juridiques en matière de données personnelles. Ces enjeux cruciaux feront l’objet du WP6, qui consistera à mener les études de risque et d’impact afin de définir le cadre juridique pour le partage des données et le niveau de cybersécurité appropriés pour le traitement des données du microbiome humain, et pour leur appariement avec des données de santé.
L’architecture et l’implémentation s’appuieront sur l’expertise et les standards développés par l’IFB (catalogue des ressources bioinformatiques, outils de FAIRisation et de data brokering) et par le réseau ELIXIR (catalogue bio.tools, workflow hub, ontologie EDAM, Federated European Genome Archive).
En tenant compte des ressources financières et des délais, le présent projet se limitera à implémenter une preuve de concept (Proof Of Concept, POC) visant à déployer toutes les briques de base et à mettre le système à l’épreuve de quelques cas d’études sélectionnés (WP7) sur base de données produites par les équipes partenaires ou disponibles en accès public.
Des ressources financières supplémentaires seront nécessaires pour le passage à l’échelle et la mise en production afin de pouvoir accueillir les autres données de microbiome humain.