Soutenances de thèses
vendredi 25 novembre 2016 à 14:00 - salle de conférence - bat. 9
Anis Hoayek (I3M)
Estimation des paramètres pour des modèles adaptés aux séries de records.
JURY: M. Gilles DUCHARME, Université de Montpellier, Directeur de these M. Hassan ZEINEDDINE ,Université Libanaise, CoDirecteur de these M. Zaher KHRAIBANI, Université Libanaise, Co-encadrant de these M. Clément DOMBRY , Université de Franche Comté, Rapporteur M. Joseph NGATCHOU WANDJI, Université de Lorraine, Rapporteur M. Jean-Noël BACRO, Université de Montpellier, Examinateur Mme Zainab ASSAGHIR, Université Libanaise, Examinateur Résumé : Dans une série chronologique, une observation est appelée record au temps «t» si sa valeur est supérieure à toutes les valeurs précédentes. Suivant l?augmentation de «t», considérons la suite des valeurs des records et la suite des indices d?occurrence des records. Les propriétés stochastiques des suites de valeurs des records ont été largement étudiées dans le cas où les observations sont des variables aléatoires indépendantes et identiquement distribuées (iid). Il se trouve que beaucoup de ces propriétés sont universelles, c?est-à-dire tiennent pour n?importe quelle loi de probabilité commune des observations. En particulier, les records ont tendance à devenir plus espacés dans le temps à mesure que «t» augmente. Cependant, ce n?est pas ce que l?on observe dans de nombreux jeux de données réelles. Ceci a conduit à l?élaboration de modèles plus complexes pour fournir une meilleure prédiction. Le modèle, peut-être le plus simple mais en tout cas le plus populaire, pour une série de records issus d?observations indépendantes mais non identiquement distribuées est le modèle à dérive linéaire (LDM). Ce modèle a été étudié par de nombreux auteurs et trouvé en accord avec certains types de données où l?hypothèse iid ne tient pas. Cependant, dans des situations pratiques, l?utilisation du LDM nécessite la détermination du paramètre de dérive du modèle et cela pousse le problème dans le domaine de la statistique. Il existe une similitude entre les records et le traitement de données censurées en analyse de survie. En particulier, toutes les observations qui tombent entre deux records consécutifs et au-delà du dernier record peuvent être considérées comme des observations censurées par le dernier record observé. Pour mettre en évidence cette similitude, on introduit la suite des indicatrices de records qui prennent la valeur 1 si l?observation est un record et 0 sinon. Un autre modèle populaire est le modèle Yang-Nevzorov. Ce modèle est intéressant car il a la structure d?un modèle à risque proportionnel en analyse de survie, lequel a montré son utilité dans ce domaine pour modéliser de nombreux jeux de données. Cependant, à notre connaissance, l?inférence statistique pour le modèle Yang-Nevzorov a été peu développé. Le but de ce travail est d?introduire certains estimateurs des différents paramètres des modèles LDM et Yang respectivement et d?en obtenir leurs propriétés statistiques. Il est montré que le mécanisme de censure est informatif pour certains paramètres. Cela justifie l?analyse des qualités d?estimateurs qui peuvent être obtenus à partir de ces indicatrices de records. Nous donnons quelques propriétés exactes et asymptotiques de ces estimateurs. Il se trouve que dans le modèle de Yang, le comportement des différents estimateurs est indépendant de la distribution sous-jacente. Notons que nos estimateurs peuvent être utilisés même lorsque les valeurs exactes des records sont elles-mêmes indisponibles ou de mauvaise qualité et les seules indicatrices sont disponibles ou fiables. En outre, il est montré que des tests d?ajustement du modèle de Yang peuvent aussi être dérivés de ces indicatrices. Ces tests ont même des capacités diagnostiques qui peuvent aider à suggérer des corrections au modèle. Toujours dans le contexte d?un modèle de Yang, nous étudions le comportement stochastique du temps inter-records et nous donnons sa loi asymptotique, indépendamment de la loi des va sous-jacentes. De plus, nous appliquons nos résultats théoriques à des données analysées précédemment par Yang. Enfin, nous passons à l?utilisation de la totalité des données disponibles (valeurs et indices/indicatrices de records) afin de calculer, par plusieurs méthodes, des estimateurs des paramètres des modèles LDM et Yang-Nevzorov. De plus, nous introduisons des tests statistiques qui nous aident à vérifier la conformité du choix de la distribution sous-jacente des observations et à choisir entre un modèle LDM et de Yang.