Séminaire de Probabilités et Statistique
lundi 16 avril 2012 à 15:00 - SupAgro, salle 9/106 (coeur d'école)
Madison Giacofci (IMAG - Laboratoire Jean Kuntzmann)
Classification non supervisée et sélection de variables dans les modèles mixtes fonctionnels
Un nombre croissant de domaines scientifiques collectent de grandes quantités de données comportant beaucoup de mesures répétées pour chaque individu. Ce type de données peut être vu comme une extension des données longitudinales en grande dimension. Le cadre naturel pour modéliser ce type de données est alors celui des modèles mixtes fonctionnels.
Nous traiterons dans un premier temps de la classification non-supervisée dans les modèles mixtes fonctionnels. Nous présenterons dans ce cadre une nouvelle procédure utilisant une décomposition en ondelettes des effets fixes et des effets aléatoires. Notre approche se décompose en deux étapes : une étape de réduction de dimension basée sur les techniques de seuillage des ondelettes et une étape de classification où l'algorithme EM est utilisé pour avoir une estimation des paramètres par maximum de vraisemblance. Nous présenterons aussi des résultats de simulations et nous illustrerons notre méthode sur des jeux de données issus de la biologie moléculaire. Cette procédure est disponible dans le package R "curvclust".
Dans un deuxième temps, nous nous interesserons à la question de la réduction de dimension dans les modèles mixtes fonctionnels. Notre approche est basée sur les techniques de sélection de variables par maximum de vraisemblance pénalisée et utilisant une pénalité L1 adaptative. Nous proposons une méthode de seuillage adaptée à la sélection des effets fixes et aléatoires. Pour cette partie, nous présenterons des résultats de simulation.