Séminaire des Doctorant·e·s
jeudi 23 avril 2009 à 17h30 -
Cécile Low-Kam (Université Montpellier II)
Extraction de motifs séquentiels inattendus selon un modèle de Markov
Désormais, de grandes bases séquentielles (biologie, marketing...) sont accessibles et de nombreux travaux proposent d'en extraire de l'information. Cependant, l'extraction de sites d'intérêt de telles bases s'avère une tâche complexe. En effet, ces sites sont de structures très diverses et surviennent parfois avec des erreurs. Les motifs séquentiels, par leur structure flexible, permettent de surmonter ces problèmes. Mais ces motifs sont souvent très nombreux alors que peu d'entre eux sont réellement pertinents. Nous proposons donc une nouvelle approche pour extraire des motifs séquentiels significatifs. Nous obtenons ainsi moins de motifs que des approches traditionnelles. Des expérimentations montrent que de tels motifs sont pertinents pour les bases biologiques.