Séminaire de Probabilités et Statistique
lundi 10 juin 2013 à 15:00 - SupAgro, salle 11/104 (château)
Pierre Neuvial (Institut de Mathématiques de Toulouse)
Evaluation des performances de méthodes de traitement de données de nombre de copies d'ADN en cancérologie
Comment évaluer le plus objectivement possible les performances d'une
méthode de traitement de données génomiques ? Les modèles de
simulation utilisés sont généralement trop simples pour refléter la
complexité des données. A l'opposé, les jeux de données réelles à
réponse connue sont souvent limités en taille, et ne permettent pas de
choisir le niveau de difficulté du problème.
Nous avons mis en place une approche originale permettant de générer
des profils de nombres de copies d'ADN réalistes et à réponse connue,
pour les applications en cancérologie. Ces profils sont construits à
partir de données réelles et d'un petit nombre de paramètres dont
l'interprétation biologique est claire: la longueur du signal, le
nombre de changements du nombre de copies, la proportion de cellules
tumorales.
J'illustrerai l'utilisation de cette approche pour évaluer les
performances des méthodes de segmentation existantes, qui visent à
identifier les changements du nombre de copies le long du génome.
Cette étude permet non seulement de comparer les méthodes, mais aussi
d'interpréter les différences entre leurs performances, à la fois du
point de vue biologique et du point de vue statistique.
Ce travail a été réalisé conjointement avec Morgane Pierre-Jean et
Guillem Rigaill.