Séminaire de Probabilités et Statistique
lundi 11 février 2008 à 10:30 - UM2 - Bât 09 - Salle 331 (3ème ét.)
Lionel Cucala (Université de Montpellier)
"Reformulation bayésienne de la méthode des K plus proches voisins"
Bien que maintenant supplantée par des méthodes plus récentes, l’heuristique des K plus proches voisins reste essentielle en classification supervisée. Dans ce travail, nous en proposons une reformulation sous forme d’un modèle statistique. Nous corrigeons ainsi les reformulations effectuées par Holmes et Adams (2002, 2003) pour lesquelles le modèle sous-jacent n’est pas proprement défini. Le modéle proposé dépend d’une constante de normalisation inconnue. Nous nous plaçons dans le paradigme bayésien et comparons différentes méthodes d’inférence palliant cette difficulté. Nous étudions les limites de l’utilisation de la pseudo-vraisemblance et de la méthode d’Ogata (1989) dans un schéma MCMC et proposons une méthode MCMC exacte basée sur la simulation parfaite par couplage. Nous illustrons les performances de cet algorithme sur divers jeux de données. Bibliographie : Holmes, C.C et Adams N.M. (2002). A probabilistic nearest-neighbour method for statistical pattern recognition. Journal of the Royal Statistical Society, Series B, 64, 295-306. Holmes, C.C et Adams N.M. (2003). Likelihood inference in nearest-neighbour classification models. Biometrika, 90, 99-112. Ogata, Y. (1989). A Monte Carlo method for high-dimensional integration. Numerische Mathematik, 55, 137-157.