Séminaire de Probabilités et Statistique
lundi 26 mars 2018 à 13:45 - UM - Bât 09 - Salle de conférence (1er étage)
Badhi Ghattas (Université Aix-Marseille)
Arbres de décision non supervisés; état de l'art, extensions et applications en médecine
Dans cet exposé je présenterai le principe de la méthode CUBT (Clustering Using Binary Trees), arbres de classification non supervisés. Proposée en 2014 pour des données continues, la méthode a été adaptée à des données qualitatives avec des heuristiques pour l'optimisation des paramètres et un indice d'importance des variables. L'approche a eu beaucoup de succès dans de nombreuses applications en médecine et en sciences sociales. Ses atouts principaux est que les clusters sont présentés par un arbre de décision binaire interprétable et utilisable pour des futures affectations de nouvelles observations (prévision). Je finirai avec quelques idées d'extensions aux données fonctionnelles et au contexte Big Data.