Mathématiques et Informatique Appliquées
du Génome à l'Environnement

 

 

Lundi 13 décembre 2021

Séminaire
Intervening organization
LMO, Université Paris-Saclay
Name of intervener
Perrine Lacroix
Title
Compromis entre risque prédictif et false discovery rate pour la régression linéaire gaussienne en grande dimension.
Abstract

En régression linéaire gaussienne, l’estimation du paramètre inconnu permet de déterminer l’ensemble des variables impliquées dans l’explication de la variable réponse au sens de la relation linéaire. Elles correspondent aux coefficients non-nuls du paramètre inconnu. Dans un soucis d’exploitation et d’interprétation du résultat de l’estimation, il est préférable de n’avoir qu’un petit nombre de variables sélectionnées. Une approche classique pour ce modèle est la sélection de variables par minimisation des moindres carrés pénalisés. Pour obtenir une inégalité oracle sur le risque prédictif, la théorie développée par (Birgé et Massart, 2001) fournit une fonction de pénalité connue à une constante multiplicative près. Cette constante est actuellement fixée à 2 via des considérations d’optimalité asymptotique sur le risque. 

Dans cet exposé, je définirai la notion de variables actives et inactives et j’expliquerai que la prédiction n’est pas suffisante pour limiter la sélection de variables inactives. Pour pallier ce problème, notre idée a été de rajouter un contrôle du false discovery rate (FDR) sur la procédure de sélection de modèle. Notre approche consiste à modifier la constante multiplicative et d’étudier l’impact de cette variation sur le FDR en plus du risque prédictif, ceci d’un point de vue théorique (sous un modèle très simplifié) et expérimental.

Place
Salle de réunion 142, bâtiment 210
Date of the day