Séminaire des Doctorant·e·s
mercredi 14 mai 2014 à 17h00 - Salle 9.11
Myriam Tami (I3M)
Estimation par algorithme EM pour modèles à facteurs et à équations structurelles
Dans de nombreux domaines, lorsqu'un phénomène nécessite d'être étudié, les sciences statistiques peuvent être employées afin de le modéliser. Le choix du type de modèle à utiliser se fait en fonction des informations et des données mesurées (organisées sous forme de variables observées sur plusieurs unités statistiques) à disposition, mais aussi en fonction de la problématique. En effet, il arrive que lors d'une modélisation on souhaite prendre en compte des notions non mesurables. Par exemple, dans le domaine du marketing, lors d'une étude de la satisfaction des consommateurs d'une gamme automobile, on souhaite tenir compte dans la modélisation de variables telles que le Confort Intérieur, le Design, la Maintenance etc. Or celles-ci ne sont pas mesurables. Elles sont dites latentes. Parmi elles, certaines peuvent être indirectement mesurables par des variables observables. La variable latente Design peut par exemple être indirectement mesurée de manière non exhaustive par la présence dans le modèle de variables observant la Capacité volumique du coffre, la Largeur ou la Hauteur sous plafond du véhicule. Les types de modèles les plus populaires dans ce genre de situation sont les modèles d'équations structurelles (SEM). Ces derniers permettent de manière plus générale, de formaliser et éprouver des hypothèses relatives à des relations de causalité entre plusieurs variables (observables, latentes, explicatives, à expliquer...). Cependant, l'utilisation de ces modèles, contraint les utilisateurs à ne prendre en entrée que des variables gaussiennes. Or, il arrive d'avoir accès à des variables de comptage ou de natures diverses. Dans le cadre de l'étude de la satisfaction des consommateurs d'une gamme automobile, une variable répertoriant le nombre de matériaux utilisés, est par exemple une variable de comptage. Prendre en compte toutes les variables auxquelles on a accès, serait une source d'information précieuse qui améliorerait la qualité d'une modélisation. Pour y parvenir, mon travail de thèse consiste à construire la théorie d'un modèle de type SEM auquel on grefferait des modèles linéaires généralisés (GLM), qui eux prennent en entrée des variables de natures diverses. Actuellement, nous développons une stratégie d'estimation efficace et rapide pour ce futur modèle. C'est avec grand plaisir que je vous présenterai l'avancé de ce travail.