Séminaire de Probabilités et Statistique :
Le 07 novembre 2011 à 15:00 - UM2 - Bât 09 - Salle 331 (3ème étage)
Présentée par Baraud Yannick - Université Nice Sophia-Antipolis
Sélection d'estimateur en régression Gaussienne
Travail en collaboration avec C. Giraud et S. Huet
Soit Y un vecteur gaussien de moyenne f dont les coordonnées sont
indépendantes et de même variance (supposée inconnue) et F une famille
arbitraire d'estimateurs de f obtenus à partir de Y.
Le cardinal de F peut être arbitrairement grand et la manière
dont les différents estimateurs dépendent de Y éventuellement inconnue.
Nous proposons une règle de sélection, ne dépendant que de Y,
en vue de sélectionner l'estimateur de la famille F ayant le plus
petit risque euclidien.
Nous établissons des bornes non-asymptotiques sur le risque de l'estimateur
sélectionné et montrons comment ces bornes se comparent à des
inégalités de type oracle dans de nombreux cas d'intérêt. Par exemple,
nous montrons comment la procédure peut être utilisée en regression
pour sélectionner un noyau et une fenêtre ou en selection de variables
pour choisir une procédure parmi toutes celles que l'on peut rencontrer
dans la littérature (Lasso, Elastic Net, Random Forest,...).
Enfin, au travers d'une étude par simulation, nous nous comparerons à la
cross-validation qui est communément utilisée en pratique.