Séminaire de Probabilités et Statistique
lundi 15 octobre 2007 à 10:30 - Campus de SupAgro (salle 9/106 coeur d'ecole)
Christophe Crambes (UM2 I3M)
"Régression linéaire fonctionnelle avec variable explicative bruitée. Application à la prévision de pics de pollution."
Dans de nombreuses applications (climatologie, télédétection, linguistique, . . . ), les données proviennent de l'observation de phénomènes continus du temps ou de l'espace. Ces données sont communément appelées données fonctionnelles dans la littérature. De nombreux modèles pour données fonctionnelles ont été étudiés, comme le modèle linéaire fonctionnel, qui est le cadre de cette étude, où on souhaite expliquer les effets d'une variable X sur une variable Y , la variable X prenant ses valeurs dans l'espace $L^2[0,1]$ des fonctions de carré intégrable sur [0,1] et la variable Y étant à valeurs réelles. On donne un estimateur du paramètre fonctionnel du modèle, dans un premier temps lorsque la variable explicative X est supposée être observée sans erreur. On construit un estimateur basé sur les splines de lissage, obtenu comme solution d'un problème de minimisation de type moindres carrés dans lequel on fait intervenir une pénalisation, pour contourner le problème lié au fait que la variable explicative vit dans un espace de dimension infinie. On donne un résultat de convergence pour cet estimateur. Dans un deuxième temps, on suppose que la variable explicative est bruitée, et on adapte l'estimateur spline construit dans le cas non bruité en généralisant la méthode des moindres carrés orthogonaux à notre cadre fonctionnel. Un résultat de convergence pour ce nouvel estimateur est là aussi donné. On évalue enfin la qualité des estimateurs construits, d'abord par le biais de simulations, puis en étudiant un jeu de données réelles visant à faire de la prévision de pics de pollution dans l'agglomération Toulousaine. Ce travail a été réalisé en collaboration avec Alois Kneip (Université Bonn) et Pascal Sarda (Université Toulouse III).