Séminaire de Probabilités et Statistique
lundi 19 octobre 2015 à 15:00 - UM2 - Bât 09 - Salle de conférence (1er étage)
Alice Cleynen (Université de Montpellier - CNRS)
Détection de ruptures dans les données de séquençage
La question de la localisation des transcrits sur un génome à partir de données de séquençage de l'ARN peut s'approcher statistiquement grâce à un modèle de segmentation dans la loi binomiale négative. Se posent alors les difficultés classiques de l'inférence des paramètres du modèle inhérentes à la segmentation avec les particularités liées aux données de séquençage : nous avons ici affaire à des données de comptage, et de taille particulièrement grande (n~10^8). Après avoir présenté les techniques permettant de surmonter ces difficultés dans un premier modèle simple, nous verrons comment il est possible de raffiner le modèle pour répondre à des questions plus fines, par exemple la comparaison de la localisation des ruptures dans des séries indépendantes. Les résultats seront illustrés sur des données issues du séquençage de l'ARN chez la levure.