Séance Séminaire

Soutenances de thèses

mercredi 16 octobre 2013 à 15:00 - salle de conf. 1er étage bat. 9

Yousri Henchiri (I3M)

L'approche Support Vector Machines pour le traitement de données fonctionnelles

omposition du jury :
Mr. Stéphane GIRARD, Rapporteur
Mr. Cristian PREDA, Rapporteur
Mr. Frédéric FERRATY, Examinateur
Mr. André MAS, Examinateur
Mr. Ali GANNOUN, Directeur de Thèse
Mr. Christophe CRAMBES, Co-encadrant de Thèse

Résumé :
L’Analyse des Données Fonctionnelles (ADF) est un domaine important et dynamique en statistique. Elle offre des outils efficaces et propose de nouveaux développements méthodologiques et théoriques en présence de données de type fonctionnel (fonctions, courbes, images, surfaces, ...). Le travail exposé dans cette thèse apporte une nouvelle contribution aux thèmes de l’apprentissage statistique et des quantiles conditionnels lorsque les données sont assimilables à des fonctions. Une attention particulière a été réservée à l’utilisation de la technique Support Vector Machines (SVMs). Cette technique fait intervenir la notion d’Espace de Hilbert à Noyau Reproduisant (EHNR). Dans ce cadre, l’objectif principal est d’étendre cette technique non-paramétrique d’estimation aux modèles conditionnels où les données sont fonctionnelles. Nous avons étudié les aspects théoriques et l’attitude pratique de la technique présentée et adaptée sur ces modèles de régression :
• le modèle fonctionnel de quantiles de régression quand la variable réponse est réelle, les variables explicatives sont à valeurs dans un espace fonctionnel de dimension infinie et les observations sont i.i.d.,
• le modèle additif fonctionnel de quantiles de régression où la variable d’intérêt réelle dépend d’un vecteur de variables explicatives fonctionnelles,
• le modèle fonctionnel de quantiles de régression quand les observations sont dépendantes.

Nous avons obtenu des résultats sur la consistance et les vitesses de convergence des estimateurs dans ces modèles. Des simulations ont été effectuées afin d’évaluer la performance des procédures d’inférence. Des applications sur des jeux de données réelles (données de chimiométrie, données environnementales et données climatiques) ont été considérées. Le bon comportement de l’estimateur SVM est ainsi mis en évidence.