Séminaire de Probabilités et Statistique
lundi 30 septembre 2013 à 15:00 - SupAgro, salle 206 bâtiment 9
Antoine Channarond (AgroParisTech)
Clustering dans l'espace latent d'un modèle de graphe aléatoire
L'hétérogénéité dans les réseaux peut être modélisée en attribuant une position dans un espace latent à chaque sommet. Les arêtes sont alors d'autant plus probables que les sommets sont proches selon une métrique donnée. Le problème posé est d'estimer dans ce modèle le nombre de clusters de la densité des positions, à l'aide uniquement du réseau observé. Dans un cadre non paramétrique, les clusters peuvent être définis comme les composantes connexes de l'ensemble de niveau t de la densité (Hartigan, 1975). Nous suivons et généralisons la stratégie de Biau, Cadre et Pelletier (2007) en utilisant le nombre de composantes connexes d'un sous-graphe bien choisi comme estimateur du nombre de clusters. Les noeuds conservés sont ceux situés dans l'ensemble de niveau, la densité étant estimée à leur position par leur degré normalisé.