Séminaire de Probabilités et Statistique
lundi 16 octobre 2017 à 13:45 - UM - Bât 09 - Salle de conférence (1er étage)
Pierre Latouche (Université Paris 1 Panthéon-Sorbonne)
The dynamic stochastic topic block model
La plupart des réseaux sociaux décrivent des échanges entre des individus, échanges se faisant par l'intermédiaire de textes. C'est en particulier le cas des réseaux de type Facebook ou Twitter, mais également des réseaux d'emails. Or, de manière tout à fait surprenante, les outils d'analyse de réseaux, qui ont pourtant été souvent motivés par des questions pratiques en sciences sociales, modélisent pour la plupart ces réseaux de manière binaire. Autrement dit, l'information de texte échangé disparaît et seules les présences ou absences de connexions entre individus sont retenues comme source de données. De plus, les échanges dans les réseaux sociaux sont généralement stockés sous la forme d'interactions. Deux individus interagissent à un temps précis qui est enregistré. Ces données sont donc dynamiques par nature. Nous proposons donc le dynamic stochastic topic block model ainsi qu'une procédure d'inférence associée permettant l'analyse conjointe d'un réseau dynamique en temps discret et d'un ensemble de textes portés par les connexions du réseau. Nous mettons en avant l'utilisation d'une variable pivot autorisant les analyses alternées du réseau et du corpus associé. Un critère de sélection de modèles est dérivé afin d'estimer le nombre de thèmes de discussions et le nombre de clusters d'individus. Nous illustrons nos résultats sur des données simulées ainsi que sur la base de données d'emails du scandale Enron.