Séminaire de Probabilités et Statistique :

Le 10 juin 2013 à 15:00 - SupAgro, salle 11/104 (château)


Présentée par Neuvial Pierre - Institut de Mathématiques de Toulouse

Evaluation des performances de méthodes de traitement de données de nombre de copies d'ADN en cancérologie



Comment évaluer le plus objectivement possible les performances d'une méthode de traitement de données génomiques ? Les modèles de simulation utilisés sont généralement trop simples pour refléter la complexité des données. A l'opposé, les jeux de données réelles à réponse connue sont souvent limités en taille, et ne permettent pas de choisir le niveau de difficulté du problème.

Nous avons mis en place une approche originale permettant de générer des profils de nombres de copies d'ADN réalistes et à réponse connue, pour les applications en cancérologie. Ces profils sont construits à partir de données réelles et d'un petit nombre de paramètres dont l'interprétation biologique est claire: la longueur du signal, le nombre de changements du nombre de copies, la proportion de cellules tumorales.

J'illustrerai l'utilisation de cette approche pour évaluer les performances des méthodes de segmentation existantes, qui visent à identifier les changements du nombre de copies le long du génome. Cette étude permet non seulement de comparer les méthodes, mais aussi d'interpréter les différences entre leurs performances, à la fois du point de vue biologique et du point de vue statistique.

Ce travail a été réalisé conjointement avec Morgane Pierre-Jean et Guillem Rigaill.



Retour