Séminaire de Probabilités et Statistique :

Le 08 avril 2013 à 15:00 - SupAgro, Salle 11/104 (château)


Présentée par Martin Marie-Laure - AgroParisTech

HTSDiff : un mélange de Poisson pour l'analyse différentielle de données de RNA-seq



De plus en plus, les études d'expression de gènes utilisent les techniques de séquençage de nouvelle génération. Afin d'expertiser cette nouvelle technologie, la plate-forme transcriptome de l'URGV a généré le transcriptome de la plante modèle Arabidopsis thaliana dans plusieurs conditions à l'aide de la dernière version de la puce CATMA et en RNA-seq et plus de 300 gènes ont été validé par qPCR. Une analyse détaillée des données suggère que, même si les technologies de séquençage sont potentiellement mieux pour quantifier l'expression des gènes que les puces à ADN, les données de RNA-seq ne sont pas exploitées de manière optimale.

La première partie de cet exposé sera consacrée à la présentation des données produites, des tests d'hypothèses généralement utilisés pour réaliser l'analyse différentielle et de leurs résultats dans le cadre de notre projet. La seconde partie sera consacrée à la reformulation de l'analyse différentielle comme un problème de classification non supervisé. Nous avons développé un modèle de mélange de Poisson permettant d'identifier les gènes différentiellement exprimés des autres et cette approche sera comparée aux tests à l'aide des données transcriptomes de l'URGV et les données de qPCR associées.



Retour