Geodesic PCA in the Wasserstein space by convex PCA

Résumé : Nous introduisons la méthode d'Analyse en Composantes Principales Géodésiques (GPCA) dans l'espace des mesures de probabilités à support sur la droite réelle, admettant un moment d'ordre deux, et muni de la métrique de Wasserstein. Nous discutons des avantages de cette approche par rapport à une ACP fonctionnelle standard de densités de probabilités dans l'espace de Hilbert des fonctions de carrés intégrable. Nous établissons la consistence de cette méthode en montrant que la GPCA empirique converge vers sa version population lorsque la taille de l'échantillon tend vers l'infini. Une propriété clé dans l'étude de la GPCA est l'isométrie entre l'espace de Wasserstein et un sous-espace convexe fermé de l'ensemble des fonctions de carrés intégrable, par rapport à une mesure de référence appropriée. De ce fait, nous considérons le problème général de l'ACP dans un sous-ensemble convexe fermé d'un espace de Hilbert séparable, qui sert de base à l'analyse de la GPCA. Nous proposons différents exemples illustratifs à partir de modèles statistiques simples pour montrer les bénéfices de cette approche pour l'analyse de données. La méthode est également appliquée à un exemple réel sur les pyramides des âges.
Type de document :
Article dans une revue
Annales de l'Institut Henri Poincaré (B) Probabilités et Statistiques, Institute Henri Poincaré, 2017, 53 (1), pp.1-26. 〈10.1214/15-aihp706〉
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01978864
Contributeur : Thierry Klein <>
Soumis le : vendredi 11 janvier 2019 - 19:04:50
Dernière modification le : jeudi 21 février 2019 - 10:52:48

Fichier

AIHP706.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

Citation

Jérémie Bigot, Raul Gouet, Thierry Klein, Alfredo Lopez. Geodesic PCA in the Wasserstein space by convex PCA. Annales de l'Institut Henri Poincaré (B) Probabilités et Statistiques, Institute Henri Poincaré, 2017, 53 (1), pp.1-26. 〈10.1214/15-aihp706〉. 〈hal-01978864〉

Partager

Métriques

Consultations de la notice

9

Téléchargements de fichiers

9