Séminaire de Probabilités et Statistique :
Le 19 juin 2006 à 10:30 -
Présentée par Besse Philippe - LSP, Université Paul Sabatier Toulouse 3
Exemples d'analyse statistique de données d'expression
Les données biologiques haut débits deviennent une source intarissable de problèmes statistiques. Ainsi, l'analyse des données d'expression justifient l'emploi de méthodes très variées : analyse d'image, normalisation et régression non paramétrique, exploration et ACP, corégulation et classification (clustering), sélection et tests multiples, modèles mixtes, sélection/prédiction et discrimination (classification), dont certaines (tests multiples, classification), sont très largement utilisées. Nous nous proposons d'aborder trois exemples donnant lieu, d'une part, à des utilisations originales de méthodes connues : analyse canonique, lissage spline, random forest, et ouvrant d'autre part sur des extensions et travaux en cours. Il s'agit donc de montrer en quoi des méthodes classiques ou moins peuvent apporter des solutions originales et pertinentes aux questions biologiques posées et aussi comment la spécificité de ces données soulève souvent des problèmes ouverts et difficiles.