Séminaire des Doctorant·e·s
mardi 10 novembre 2015 à 17h00 - Salle 9.11
Jocelyn Chauvet (IMAG)
Différentes stratégies d'estimation dans les modèles linéaires mixtes (L2M) en grande dimension
C'est un fait, la statistique se confronte actuellement à un accroissement de la masse et de la taille des données. Dans un premier temps, la grande dimension des données, c'est-à-dire le nombre important de covariables à disposition pour expliquer un phénomène, pose un ensemble de problèmes, communément résumés par le terme "fléau de la dimension". En particulier, les redondances multiples au sein de ces covariables nous empêchent de distinguer leurs effets propres. Cela provoque alors une certaine instabilité des estimateurs, ce qui détériore tant leurs qualités prédictives qu'explicatives. De plus, le nombre d'individus intervenant dans les modélisations est également de plus en plus grand... Et dans beaucoup de situations (données répétées ou spatialisées), on ne peut raisonnablement pas supposer les individus indépendants. Les modèles linéaires "mixtes" constituent ici un bon moyen de distinguer la part du phénomène expliquée par les covariables et celle liée à la structure de dépendance entre les individus. Dans cet exposé, je présenterai deux stratégies concurrentes qui se proposent de se confronter à la conjonction des deux problèmes précédemments évoqués. Basées toutes les deux sur les L2M pour gérer la dépendance entre les individus, elles adoptent par contre un point de vue radicalement différent pour faire face à la forte redondance au sein des covariables.