Médiane géométrique

En géométrie, la médiane géométrique d'un ensemble discret de points d'un échantillon dans un espace euclidien est le point minimisant la somme des distances aux points de l'échantillon. Cela généralise la médiane, qui a la propriété de minimiser la somme des distances pour les données unidimensionnelles, et fournit un indicateur de tendance centrale dans les dimensions supérieures. Il est également connu sous le nom de médiane spatiale^[1], point de somme euclidienne minimum^[1], point de Torricelli^[2], ou 1-médiane.

La médiane géométrique est un estimateur de localisation important en statistique^[3] car elle minimise la somme des distances L₂ des échantillons^[4]. Elle se compare donc à la moyenne, qui minimise la somme du carré des distances L₂, et à la médiane par composante qui minimise la somme des distances L₁. C'est également un problème standard d'emplacement des installations, où il modélise le problème de la localisation d'une installation afin de minimiser le coût du transport^[5]. Le problème k -médiane plus général demande l'emplacement des k centres de cluster en minimisant la somme des distances entre chaque point d'échantillon et son centre le plus proche.

Le cas particulier du problème des trois points du plan (c'est-à-dire $m$ = 3 et $n$ = 2 dans la définition ci-dessous) est parfois également connu sous le nom de problème de Fermat ; il apparaît dans la construction des arbres de Steiner minimaux et a été initialement posé comme problème par Pierre de Fermat et résolu par Evangelista Torricelli^[6]. Sa solution est maintenant connue sous le nom de point de Fermat du triangle formé par les trois points de l'échantillon^[7]. La médiane géométrique peut à son tour être généralisée au problème de la minimisation de la somme des distances pondérées, connu sous le nom de problème de Weber d'après la discussion du problème par Alfred Weber dans son livre de 1909 sur l'emplacement des installations. Certaines sources appellent plutôt le problème de Weber le problème de Fermat-Weber^[8], mais d'autres utilisent ce nom pour le problème de la médiane géométrique non pondérée^[9].

Wesolowsky (1993) fournit une étude du problème de la médiane géométrique. Fekete, Mitchell & Beurer (2005) se sont posés la question du problème pour des points non discrets.

Définition[modifier | modifier le code]

Formellement, pour un ensemble donné de m points $\mathbb {X} ^{m}=x_{1},x_{2},\dots ,x_{m}\,$ avec chaque $x_{i}\in \mathbb {R} ^{n}$ , la médiane géométrique est définie comme le minimiseur de la somme des distances L₂

{\underset {y\in \mathbb {R} ^{n}}{\operatorname {arg\,min} }}\sum _{i=1}^{m}\left\|x_{i}-y\right\|_{2}

Ici, arg min signifie la valeur de l'argument $y$ ce qui minimise la somme. Dans ce cas, c'est le point $y$ dans un espace euclidien à n dimensions d'où la somme de toutes les distances euclidiennes jusqu'au $x_{i}$ est minimale.

Propriétés[modifier | modifier le code]

Pour le cas unidimensionnel, la médiane géométrique coïncide avec la médiane. En effet, la médiane univariée minimise également la somme des distances aux points. (Plus précisément, si les points sont p ₁, …, p _n, dans cet ordre, la médiane géométrique est le point médian $p_{(n+1)/2}$ si n est impair, mais n'est pas déterminé de manière unique si n est pair, auquel cas il peut s'agir de n'importe quel point du segment de droite entre les deux points intermédiaires $p_{n/2}$ et $p_{(n/2)+1}$ ) ^[10]^,^[11]
La médiane géométrique est unique lorsque les points ne sont pas colinéaires.
La médiane géométrique est équivariante par similitude euclidienne, y compris par translation et rotation^[12]^,^[10]. Cela signifie que l'on obtiendrait le même résultat soit en transformant la médiane géométrique, soit en appliquant la même transformation aux données de l'échantillon et en trouvant la médiane géométrique des données transformées. Cette propriété découle du fait que la médiane géométrique est définie uniquement à partir des distances par paires et ne dépend pas du système de coordonnées cartésiennes orthogonales par lequel les données de l'échantillon sont représentées. En revanche, la médiane par composante d’un ensemble de données multivariées n’est généralement pas invariante par rotation, ni indépendante du choix des coordonnées^[12].
La médiane géométrique a un point de rupture de 0,5^[12]. Autrement dit, jusqu'à la moitié des données de l'échantillon peuvent être arbitrairement corrompues, et la médiane des échantillons fournira toujours un estimateur robuste pour l'emplacement des données non corrompues.

Cas spéciaux[modifier | modifier le code]

Pour 3 points (non colinéaires), si un angle du triangle formé par ces points est de 120° ou plus, alors la médiane géométrique est le point au sommet de cet angle. Si tous les angles sont inférieurs à 120°, la médiane géométrique est le point à l'intérieur du triangle qui sous-tend un angle de 120° à chacune des trois paires de sommets du triangle. Ceci est également connu sous le nom de point de Fermat du triangle formé par les trois sommets. (Si les trois points sont colinéaires alors la médiane géométrique est le point entre les deux autres points, comme c'est le cas avec une médiane unidimensionnelle.)
Pour 4 points coplanaires, si l'un des quatre points est à l'intérieur du triangle formé par les trois autres points, alors la médiane géométrique est ce point. Sinon, les quatre points forment un quadrilatère convexe et la médiane géométrique est le point de croisement des diagonales du quadrilatère. La médiane géométrique de quatre points coplanaires est la même que le point de Radon unique des quatre points.

Calcul[modifier | modifier le code]

Bien que la médiane géométrique soit un concept facile à comprendre, son calcul constitue un défi. Le centroïde ou centre de masse, défini de la même manière que la médiane géométrique comme minimisant la somme des carrés des distances à chaque point, peut être trouvé par une formule simple — ses coordonnées sont les moyennes des coordonnées des points — mais il a été démontré qu'aucune formule explicite, ni algorithme exact impliquant uniquement des opérations arithmétiques et des racines k ièmes , ne peuvent exister en général pour la médiane géométrique. Par conséquent, seules des approximations numériques ou symboliques de la solution de ce problème sont possibles dans ce modèle de calcul.

Cependant, il est simple de calculer une approximation de la médiane géométrique en utilisant un algorithme itératif dans lequel chaque étape produit une approximation plus précise. Des procédés de ce type peuvent être dérivés du fait que la somme des distances aux points d'échantillonnage est une fonction convexe, puisque la distance à chaque point d'échantillonnage est convexe et que la somme des fonctions convexes reste convexe. Par conséquent, les algorithmes qui diminuent la somme des distances à chaque étape ne peuvent pas rester piégées dans un optimal local.

Une approche courante de ce type, appelée algorithme de Weiszfeld d'après les travaux d'Endre Weiszfeld, est une forme de moindres carrés itérativement repondérés. Cet algorithme définit un ensemble de poids inversement proportionnels aux distances entre l'estimation actuelle et les points d'échantillonnage, et crée une nouvelle estimation qui est la moyenne pondérée de l'échantillon en fonction de ces poids. C'est,

\left.y_{k+1}=\left(\sum _{i=1}^{m}{\frac {x_{i}}{\|x_{i}-y_{k}\|}}\right)\right/\left(\sum _{i=1}^{m}{\frac {1}{\|x_{i}-y_{k}\|}}\right).

Cette méthode converge pour presque toutes les positions initiales, mais peut échouer lorsqu'une de ses estimations tombe sur l'un des points donnés. Il peut être modifié pour gérer ces cas afin qu'il converge pour tous les points initiaux.

Bose, Maheshwari & Morin (2003) ont décrit des algorithmes d'optimisation géométrique plus sophistiqués pour trouver des solutions approximativement optimales à ce problème. Cohen et al. (2016) ont montré comment calculer la médiane géométrique avec une précision arbitraire en un temps quasi linéaire. On peut remarquer que ce problème peut être reformulé comme un programme du cône de second ordre

{\underset {y\in \mathbb {R} ^{n},\ s\in \mathbb {R} ^{m}}{\min }}\ \sum _{i=1}^{m}s_{i}{\text{ avec }}s_{i}\geq \left\|x_{i}-y\right\|_{2}{\text{ pour }}i=1,\ldots ,m,

qui peut être résolu en temps polynomial à l'aide de solveurs d'optimisation courants.

Caractérisation de la médiane géométrique[modifier | modifier le code]

Si y est distinct de tous les points donnés x_i, alors y est la médiane géométrique si et seulement si elle satisfait :

0=\sum _{i=1}^{m}{\frac {x_{i}-y}{\left\|x_{i}-y\right\|}}.

Cela équivaut à :

\left.y=\left(\sum _{i=1}^{m}{\frac {x_{i}}{\|x_{i}-y\|}}\right)\right/\left(\sum _{i=1}^{m}{\frac {1}{\|x_{i}-y\|}}\right),

qui est étroitement lié à l'algorithme de Weiszfeld.

En général, y est la médiane géométrique si et seulement s'il existe des vecteurs u_i tels que :

0=\sum _{i=1}^{m}u_{i}

où pour x_i ≠ y ,

u_{i}={\frac {x_{i}-y}{\left\|x_{i}-y\right\|}}

et pour x_i = y ,

\|u_{i}\|\leq 1.

Une formulation équivalente de cette condition est

\sum _{1\leq i\leq m,x_{i}\neq y}{\frac {x_{i}-y}{\left\|x_{i}-y\right\|}}\leq \left|\{\,i\mid 1\leq i\leq m,x_{i}=y\,\}\right|.

Cela peut être vu comme une généralisation de la propriété de la médiane, dans le sens où toute partition des points, en particulier induite par tout hyperplan passant par y, a la même somme opposée de directions positives de y de chaque côté. Dans le cas unidimensionnel, l'hyperplan est le point y lui-même, et la somme des directions se simplifie en mesure de comptage (dirigée).

Généralisations[modifier | modifier le code]

La médiane géométrique peut être généralisée des espaces euclidiens aux variétés riemanniennes générales (et même aux espaces métriques ) en utilisant la même idée qui est utilisée pour définir la moyenne de Fréchet sur une variété riemannienne ^[13]^, ^[14]. Soit $M$ une variété riemannienne avec une fonction de distance correspondante $d(\cdot ,\cdot )$ , soient $w_{1},\ldots ,w_{n}$ $n$ poids dont la somme vaut 1, et soient $x_{1},\ldots ,x_{n}$ $n$ observations de $M$ . Ensuite, on définit la médiane géométrique pondérée $m$ (ou médiane de Fréchet pondérée) des données comme

m={\underset {x\in M}{\operatorname {arg\,min} }}\sum _{i=1}^{n}w_{i}d(x,x_{i})

.

Si tous les poids sont égaux, on dit simplement que $m$ est la médiane géométrique.

Voir également[modifier | modifier le code]

Références[modifier | modifier le code]

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Geometric median » (voir la liste des auteurs).

↑ ^{a et b} Drezner et al. 2002
↑ Cieslik (2006).
↑ Lawera et Thompson (1993).
↑ Dodge et Rousson (1999).
↑ Eiselt et Marianov (2011).
↑ Krarup et Vajda (1997).
↑ Spain (1996).
↑ Brimberg (1995).
↑ Bose, Maheshwari et Morin (2003).
↑ ^{a et b} Haldane 1948
↑ Claim 18.10, Geometric Methods and Optimization Problems, V. Boltyanski, H. Martini, V. Soltan, Springer, 1999.
↑ ^{a b et c} Lopuhaä et Rousseeuw 1991
↑ P. Thomas Fletcher et Suresh Venkatasubramanian « Robust statistics on Riemannian manifolds via the geometric median » (23 juin 2008) (lire en ligne)
—IEEE Conference on Computer Vision and Pattern Recognition
— « (ibid.) », dans 2008 IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, AK, USA, IEEE
↑ Fletcher, Venkatasubramanian et Joshi (2009).

Bibliographie[modifier | modifier le code]

Chanderjit Bajaj, « Proving geometric algorithms nonsolvability: An application of factoring polynomials », Journal of Symbolic Computation, vol. 2,‎ 1986, p. 99–102 (DOI 10.1016/S0747-7171(86)80015-3 )
Chanderjit Bajaj, « The algebraic degree of geometric optimization problems », Discrete & Computational Geometry, vol. 3, n^o 2,‎ 1988, p. 177–191 (DOI 10.1007/BF02187906 , lire en ligne)
Prosenjit Bose, Anil Maheshwari et Pat Morin, « Fast approximations for sums of distances, clustering and the Fermat–Weber problem », Computational Geometry: Theory and Applications, vol. 24, n^o 3,‎ 2003, p. 135–146 (DOI 10.1016/S0925-7721(02)00102-5 , lire en ligne)
J. Brimberg, « The Fermat–Weber location problem revisited », Mathematical Programming, vol. 71, n^o 1, Ser. A,‎ 1995, p. 71–76 (DOI 10.1007/BF01592245, MR 1362958, S2CID 206800756)
R. Chandrasekaran et A. Tamir, « Open questions concerning Weiszfeld's algorithm for the Fermat-Weber location problem », Mathematical Programming, vol. 44, n^os 1–3,‎ 1989, p. 293–295 (DOI 10.1007/BF01587094, S2CID 43224801)
Dietmar Cieslik, Shortest Connectivity: An Introduction with Applications in Phylogeny, vol. 17, Springer, coll. « Combinatorial Optimization », 2006 (ISBN 9780387235394, lire en ligne), p. 3
E. J. Cockayne et Z. A. Melzak, « Euclidean constructability in graph minimization problems », Mathematics Magazine, vol. 42, n^o 4,‎ 1969, p. 206–208 (DOI 10.2307/2688541, JSTOR 2688541)
Michael Cohen, Yin Tat Lee, Gary Miller, Jakub Pachocki et Aaron Sidford « Proc. 48th Symposium on Theory of Computing (STOC 2016) » (2016) (DOI 10.1145/2897518.2897647, arXiv 1606.05225)
Yadolah Dodge et Valentin Rousson, « Multivariate $L 1$ mean », Metrika, vol. 49, n^o 2,‎ septembre 1999, p. 127–134 (DOI 10.1007/s001840050029)
Zvi Drezner, Kathrin Klamroth, Anita Schöbel et George O. Wesolowsky « The Weber problem » (2002) (MR 1933966, lire en ligne)
— « (ibid.) », dans Facility Location: Applications and Theory, Springer, Berlin (ISBN 9783540213451), p. 1–36
H. A. Eiselt et Vladimir Marianov, Foundations of Location Analysis, vol. 155, Springer, coll. « International Series in Operations Research & Management Science », 2011 (ISBN 9781441975720, lire en ligne), p. 6
Sándor P. Fekete, Joseph S. B. Mitchell et Karin Beurer, « On the continuous Fermat-Weber problem », Operations Research, vol. 53, n^o 1,‎ 2005, p. 61–76 (DOI 10.1287/opre.1040.0137, arXiv cs.CG/0310027, S2CID 1121)
P. Thomas Fletcher, Suresh Venkatasubramanian et Sarang Joshi, « The geometric median on Riemannian manifolds with application to robust atlas estimation », NeuroImage, vol. 45, n^o 1 Suppl,‎ 2009, s143–s152 (PMID 19056498, PMCID 2735114, DOI 10.1016/j.neuroimage.2008.10.052)
J. B. S. Haldane, « Note on the median of a multivariate distribution », Biometrika, vol. 35, n^os 3–4,‎ 1948, p. 414–417 (DOI 10.1093/biomet/35.3-4.414)
Jakob Krarup et Steven Vajda, « On Torricelli's geometrical solution to a problem of Fermat », IMA Journal of Mathematics Applied in Business and Industry, vol. 8, n^o 3,‎ 1997, p. 215–224 (DOI 10.1093/imaman/8.3.215, MR 1473041)
Harold W. Kuhn, « A note on Fermat's problem », Mathematical Programming, vol. 4, n^o 1,‎ 1973, p. 98–107 (DOI 10.1007/BF01584648, S2CID 22534094)
Martin Lawera et James R. Thompson « Some problems of estimation and testing in multivariate statistical process control » (1993) (lire en ligne) [archive du 17 mai 2014]
— « (ibid.) », dans Proceedings of the 38th Conference on the Design of Experiments, vol. 93-2, coll. « U.S. Army Research Office Report », p. 99–126
Hendrick P. Lopuhaä et Peter J. Rousseeuw, « Breakdown points of affine equivariant estimators of multivariate location and covariance matrices », Annals of Statistics, vol. 19, n^o 1,‎ 1991, p. 229–248 (DOI 10.1214/aos/1176347978 , JSTOR 2241852, lire en ligne)
Jiawang Nie, Pablo A. Parrilo et Bernd Sturmfels, Algorithms in Algebraic Geometry, vol. 146, Springer-Verlag, coll. « IMA Volumes in Mathematics and its Applications », 2008, 117–132 p. (DOI 10.1007/978-0-387-75155-9_7, Bibcode 2007math......2005N, arXiv math/0702005, S2CID 16558095)
L. Ostresh, « Convergence of a class of iterative methods for solving Weber location problem », Operations Research, vol. 26, n^o 4,‎ 1978, p. 597–609 (DOI 10.1287/opre.26.4.597)
Frank Plastria, « Four-point Fermat location problems revisited. New proofs and extensions of old results », IMA Journal of Management Mathematics, vol. 17, n^o 4,‎ 2006, p. 387–396 (DOI 10.1093/imaman/dpl007, zbMATH 1126.90046, lire en ligne).
P. G. Spain, « The Fermat point of a triangle », Mathematics Magazine, vol. 69, n^o 2,‎ 1996, p. 131–133 (DOI 10.1080/0025570X.1996.11996409, JSTOR 2690672?origin=pubexport, MR 1573157)
Yehuda Vardi et Cun-Hui Zhang, « The multivariate $L 1$ -median and associated data depth », Proceedings of the National Academy of Sciences of the United States of America, vol. 97, n^o 4,‎ 2000, p. 1423–1426 (electronic) (PMID 10677477, PMCID 26449, DOI 10.1073/pnas.97.4.1423 , Bibcode 2000PNAS...97.1423V, MR 1740461)
(de) Alfred Weber, Über den Standort der Industrien, Erster Teil: Reine Theorie des Standortes, Tübingen, Mohr, 1909
G. Wesolowsky, « The Weber problem: History and perspective », Location Science, vol. 1,‎ 1993, p. 5–23
E. Weiszfeld, « Sur le point pour lequel la somme des distances de $n$ points donnes est minimum », Tohoku Mathematical Journal, vol. 43,‎ 1937, p. 355–386 (lire en ligne) Translated into English as E. Weiszfeld et Frank Plastria, « On the point for which the sum of the distances to $n$ given points is minimum », Annals of Operations Research, vol. 167, n^o 1,‎ avril 2008, p. 7–41 (DOI 10.1007/s10479-008-0352-z, S2CID 21000317)

Portail des probabilités et de la statistique

[dksw-1] {a et b} Drezner et al. 2002

[Cieslik2006-2] Cieslik (2006).

[LaweraThompson1993-3] Lawera et Thompson (1993).

[DodgeRousson1999-4] Dodge et Rousson (1999).

[EiseltMarianov2011-5] Eiselt et Marianov (2011).

[KrarupVajda1997-6] Krarup et Vajda (1997).

[Spain1996-7] Spain (1996).

[Brimberg1995-8] Brimberg (1995).

[BoseMaheshwariMorin2003-9] Bose, Maheshwari et Morin (2003).

[haldane-10] {a et b} Haldane 1948

[11] Claim 18.10, Geometric Methods and Optimization Problems, V. Boltyanski, H. Martini, V. Soltan, Springer, 1999.

[lr-12] {a b et c} Lopuhaä et Rousseeuw 1991

[13] P. Thomas Fletcher et Suresh Venkatasubramanian « Robust statistics on Riemannian manifolds via the geometric median » (23 juin 2008) (lire en ligne)
—IEEE Conference on Computer Vision and Pattern Recognition
— « (ibid.) », dans 2008 IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, AK, USA, IEEE

[FletcherVenkatasubramanianJoshi2009-14] Fletcher, Venkatasubramanian et Joshi (2009).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]