Séminaire des Doctorant·e·s
mercredi 04 décembre 2013 à 17h15 - Salle 9.11
Coralie Merle (I3M-CBGP)
Accélération des méthodes d'échantillonnage préférentiel pour le calcul de vraisemblances en génétique des populations.
Sous neutralité, l'évolution génétique est modélisée par des processus stochastiques complexes (comme le coalescent de Kingman) prenant en compte simultanément les mutations, la dérive génétique ou la sélection. Répondre à des questions d'intérêt biologique est un problème méthodologique délicat. La généalogie, les dates des mutations et les génotypes ancestraux décrits par le modèle stochastique ne sont pas observés directement. On parle de processus latents. La vraisemblance des données s'obtient en sommant sur toutes les possibilités pour la variable latente. Dans notre cas, l'espace de la variable latente est de très grande dimension, supérieure à celle de l'espace des données, ce qui rend la vraisemblance incalculable. On s'intéresse dans cet exposé à des méthodes fréquentielles. L'idée est de s'attaquer au calcul de la vraisemblance par une méthode d'échantillonnage préférentiel. L'algorithme d'échantillonnage préférentiel séquentiel tire aléatoirement un grand nombre de réalisations de la variable latente suivant une loi appelée loi d'importance. La qualité de l'estimation et le coût de calcul dépendent alors du choix de la loi d'importance et du nombre de tirages. Le but est d'améliorer la loi d'importance pour des modèles complexes non traités dans la littérature dans le but d'augmenter la qualité d'estimation à coût de calcul fixé. Un première amélioration a été obtenue grâce à des techniques de ré-échantillonnages que j'exposerai.