Séminaire de Probabilités et Statistique
lundi 04 juin 2007 à 10:30 - AgroM, salle 11/101 Châeau
Gilles Celeux (INRIA Futurs, projet Select)
"Procédure de sélection de variables en classification non surpervisée avec des mélanges gaussiens."
Il s'agit d'un travail joint avec Cathy Maugis (Paris-Sud) et Marie-Laure Martin-Magniette (INRA). On propose une méthodes de sélection de variables en classification sous un modèle de mélange gaussien. L'approche proposée, qui est une généralisation d'une approche de Raftery et Dean (2006, JASA), distingue deux statuts pour les variables: soit les variables sont classifiantes, c'est-à-dire jouent un rôle dans la classification ; soit elles sont expliquées par tout ou partie ces variables classifiantes. La méthode comporte ainsi deux procédures emboîtées de sélection descendante avec remise en cause des variables qui sont arrêtées par des critères de type BIC. Une illustration sur des données d'expression de gènes sera proposée. Pour plus d'informations, cliquer ici.