Séminaire de Probabilités et Statistique
lundi 23 septembre 2019 à 13:45 - UM - Bât 09 - Salle de conférence (1er étage)
Philippe Berthet (Université de Toulouse)
Convergences exactes des contrastes quantiles empiriques de Kantorovitch
Dans le contexte des tests d'hypothèses, notamment d'adéquation, de mesure de dissimilarité ou de comparaison d'échantillons, les distances de Wasserstein sont de plus en plus utilisées. Nous généralisons cette distance aux contrastes de Kantorovitch, lorsque le coût de transport est convexe non nécessairement symétrique. Les versions spatiale directionnelles conduisent à définir des surfaces de Kantorovitch. Avec Thierry Klein et Jean-Claude Fort dans un travail fondateur, puis dans une série d'articles avec Jean-Claude Fort pour approfondir la multitude des situations, nous avons décrit très précisément les convergences en loi d'estimateurs non-paramétriques de ces contrastes, asymptotiquement toujours sans biais mais pas toujours gaussiens. Ces estimateurs sont simples et rapides à calculer car uniquement fondés sur les quantiles empiriques, mais très délicats à contrôler mathématiquement car moyennent des termes aléatoires qui explosent, ne sont pas indépendants ni de même loi. En particulier, aucune delta-méthode ne peut s'appliquer sans tronquer, aucune méthode de moment non plus, et le lien entre les lois marginales comparées et la nature du coût en zéro et l'infini est très subtil et strictement déterminant, ce qui n'avait pas été observé en détails. Dans le cas de deux échantillons nous autorisons qu'ils soient joints, ce qui est original et très instructif, et permet de donner un rôle particulier au transport optimal. Je dresserai un panorama des motivations, des objets de base, des objets dérivés, des méthodes de tests multiples envisagées, des méthodes de preuves, de la question de la séparation du centrage et des extrêmes sources de biais, et bien évidemment des résultats avec vitesses et limites explicites. Les conditions suffisantes sont explicites et faciles à vérifier et surtout sans besoin de tronquer ni de supposer des convergences de résidus comme dans la littérature sur ce thème, et permettent de préciser la puissance des tests sous diverses alternatives locales non-paramétriques.