Lundi 13 décembre 2021

SĂ©minaire
Organisme intervenant (ou équipe pour les séminaires internes)
LMO, Université Paris-Saclay
Nom intervenant
Perrine Lacroix
Titre
Compromis entre risque prédictif et false discovery rate pour la régression linéaire gaussienne en grande dimension.
Résumé

En rĂ©gression linĂ©aire gaussienne, l’estimation du paramètre inconnu permet de dĂ©terminer l’ensemble des variables impliquĂ©es dans l’explication de la variable rĂ©ponse au sens de la relation linĂ©aire. Elles correspondent aux coefficients non-nuls du paramètre inconnu. Dans un soucis d’exploitation et d’interprĂ©tation du rĂ©sultat de l’estimation, il est prĂ©fĂ©rable de n’avoir qu’un petit nombre de variables sĂ©lectionnĂ©es. Une approche classique pour ce modèle est la sĂ©lection de variables par minimisation des moindres carrĂ©s pĂ©nalisĂ©s. Pour obtenir une inĂ©galitĂ© oracle sur le risque prĂ©dictif, la thĂ©orie dĂ©veloppĂ©e par (BirgĂ© et Massart, 2001) fournit une fonction de pĂ©nalitĂ© connue Ă  une constante multiplicative près. Cette constante est actuellement fixĂ©e Ă  2 via des considĂ©rations d’optimalitĂ© asymptotique sur le risque. 

Dans cet exposé, je définirai la notion de variables actives et inactives et j’expliquerai que la prédiction n’est pas suffisante pour limiter la sélection de variables inactives. Pour pallier ce problème, notre idée a été de rajouter un contrôle du false discovery rate (FDR) sur la procédure de sélection de modèle. Notre approche consiste à modifier la constante multiplicative et d’étudier l’impact de cette variation sur le FDR en plus du risque prédictif, ceci d’un point de vue théorique (sous un modèle très simplifié) et expérimental.

Lieu
Salle de réunion 142, bâtiment 210
Date du jour