Séminaire de Probabilités et Statistique
lundi 10 octobre 2005 à 10:30 - Campus ENSA-M INRA
Marie-Luce Taupin (Université Paris-Sud Orsay)
Estimation non paramétrique dans un modèle de régression avec erreurs sur les variables
We consider the regression model with errors-in-variables where we observe $n$ i.i.d. copies of $(Y,Z)$ satisfying $Y=f(X)+\xi, \; Z=X+\sigma\varepsilon$, involving independent and unobserved random variables $X,\xi,\varepsilon$. The density $g$ of $X$ is unknown, whereas, the density of $\sigma\varepsilon$, $(1/\sigma)f_\varepsilon(./\sigma)$, is completely known. Using the observations $(Y_i, Z_i)$, $i=1,\cdots,n$, we propose an estimator of the regression function $f$, built as the ratio of two penalized minimum contrast estimators of $\ell=fg$ and $g$, without any prior knowledge on their smoothness. We prove that its $\mathbb{L}_2$-risk on a compact set is bounded by the sum of the two $\mathbb{L}_2(\mathbb{R})$-risks of the estimators of $\ell$ and $g$, and give the rate of convergence of such estimators for various smoothness classes for $\ell$ and $g$, when the errors $\varepsilon$ are either ordinary smooth or super smooth. The resulting rate is optimal in a minimax sense in all cases where lower bounds are available. \vspace{1cm} Consid\'erons le mod\`ele de r\'egression avec erreurs sur les variables o\`u l'on observe $n$ copies i.i.d. de $(Y,Z)$ satisfaisant les relations $Y=f(X)+\xi, \; Z=X+\sigma\varepsilon$, ces relations faisant appara\^{\i}tre des variables al\'eatoires ind\'ependantes et non observ\'ees $X,\xi,\varepsilon$. La densit\'e $g$ des $X_i$ est inconnue, tandis que la densit\'e du bruit $\sigma \varepsilon$ est compl\`etement connue. Nous proposons un estimateur $\tilde f$ de la fonction de r\'egression $f$, bas\'e sur les observations $(Y_1,Z_1)\cdots,(Y_n,Z_n)$, et construit comme le ratio de deux estimateurs de $\ell=fg$ et de $g$, obtenus par minisation d'un contraste p\'enalis\'e. Ces estimateurs sont construits sans aucune connaissance \`a priori des r\'egularit\'es de $\ell=fg$ et de $g$. Nous montrons que le risque $\mathbb{L}_2$ de $\tilde f$ sur un ensemble compact, est major\'e par la somme des risques $\mathbb{L}_2(\mathbb{R})$ des estimateurs de $\ell$ et de $g$, et donnons des majorations des vitesses de convergence pour des classes de r\'egularit\'e vari\'ees pour $\ell$ et $g$, que le bruit $\sigma \varepsilon$ soit peu ou tr\`es r\'egulier. La vitesse de convergence de $\tilde f$ est la vitesse de convergence minimax dans tous les cas o\`u des minorations sont connues.