Recherche des deux points les plus rapprochés

En géométrie algorithmique, la recherche des deux points les plus rapprochés est le problème qui consiste à trouver une paire de points d'un ensemble fini de points dans un espace métrique dont la distance est minimale. Il fait partie des problèmes fondateurs de la géométrie algorithmique^[1].

Algorithmes en dimension 2

Algorithme naïf

En notant $n$ le nombre de points, l'algorithme naïf par recherche exhaustive a une complexité en temps en $O(n^{2})$ . Il y a en effet ${\frac {n(n-1)}{2}}$ paires différentes à tester.

Algorithme quasi linéaire

Il existe un algorithme basé sur diviser pour régner en $O(n\log n)$ ^[2].

Description générale

L'algorithme se déroule en plusieurs étapes^[3]:

Préliminaire : créer deux tableaux $T_{x}$ et $T_{y}$ contenant les $n$ points à étudier. Trier $T_{x}$ et $T_{y}$ respectivement par abscisses croissantes et par ordonnées croissantes.
Diviser : Si $n>3$ , trouver une droite verticale qui sépare l'ensemble de points en deux sous-ensembles tels que celui de gauche compte $\left\lfloor {\frac {n}{2}}\right\rfloor$ points et celui de droite $n-\left\lfloor {\frac {n}{2}}\right\rfloor$ . Sinon faire une recherche exhaustive.
Régner : Résoudre récursivement les deux sous-problèmes obtenus, et récupérer le minimum $\delta$ des deux solutions.
Combiner : Comparer le minimum obtenu dans la résolution des deux sous-problèmes, ainsi que le minimum obtenu pour des paires dont chaque extrémité est issue d'un sous-problème distinct. C'est l'étape qui nécessite le plus d'instructions.

Détail de l'étape de combinaison

La résolution des deux sous-problèmes permet de déterminer que si la paire de points les plus proches a une extrémité de chaque côté de la droite de partition, alors la distance qui les sépare est inférieure à $\delta$ . Il suffit donc de s'intéresser à la bande verticale de largeur $2\delta$ centrée en la droite de partition. On procède comme suit^[3]:

Créer un tableau $T'_{y}$ ne contenant que les points de $T_{y}$ compris dans la bande considérée triés selon les ordonnées croissantes.
Pour chaque point $P$ de la bande, calculer la distance qui sépare $P$ aux 7 points qui le suivent dans le tableau $T'_{y}$ et noter le minimum $\delta '$ de toutes les distances obtenues.
Si $\delta '<\delta$ renvoyer $\delta '$ sinon renvoyer $\delta$ .

Preuve de validité de l'algorithme

Dans cette configuration, tous les points sont séparés d'une distance $\delta$ , et il y en a 8 en considérant que les points sur la droite frontière sont dédoublés et comptés l'un à gauche et l'autre à droite. Il n'est pas possible de rajouter un neuvième point dans cette configuration.

Le grand rectangle est découpé en 8 carrés de côté ${\frac {\delta }{2}}$ . Deux points dans un de ces 8 tiroirs sont séparés de moins de $\delta$ : on ne peut donc pas placer 9 points séparés de $\delta$ dans le grand rectangle.

La terminaison de l'algorithme est assurée par le fait que l'on a choisi pour limite de récursivité $n\leq 3$ , ce qui assure qu'aucun appel récursif n'est lancé sur un seul point^[3].

Le point le plus important à vérifier pour établir la correction de l'algorithme est le fait que dans l'étape de combinaison des résultats des sous-problèmes, il suffit de calculer la distance entre chaque point et les sept suivants dans $T'_{y}$ pour trouver une éventuelle paire de points séparés d'une distance inférieure à $\delta$ ^[3]. On suppose qu'il existe pour l'un des sous-problèmes récursifs une paire de points $P\in {\mathtt {Gauche}}$ et $P'\in {\mathtt {Droite}}$ séparés d'une distance inférieure à $\delta$ (où $\delta$ est le minimum des distances trouvées dans ${\mathtt {Gauche}}$ et ${\mathtt {Droite}}$ séparément). $P$ et $P'$ sont tous deux compris dans un même rectangle centré sur la droite de partition, de longueur $2\delta$ et de hauteur $\delta$ .

On cherche à savoir combien de points au maximum peuvent se trouver dans ce rectangle, sachant que deux points situés du même côté de la droite de partition sont distants d'au moins $\delta$ . La réponse est 8 : un à chaque coin, et un couple de points superposés situé à chacun des milieux des grands côtés du rectangle^[3]. Cet argument repose sur l'intuition géométrique et n'est pas adapté à une formalisation rigoureuse, mais peut être remplacé par une utilisation du principe des tiroirs qui donne la même borne de manière rigoureuse^[4]. Par conséquent au plus 7 autres points de la bande ont une ordonnée supérieure de moins de $\delta$ à l'ordonnée du point $P$ . On peut donc trouver $P'$ en calculant au plus 7 distances depuis $P$ . On peut donc trouver une paire minimale si elle existe au sein de la bande en calculant pour chacun de ses points les distances qui le séparent des 7 points qui le suivent dans $T'_{y}$ ^[3].

La validité du reste de l'algorithme ne nécessite pas de preuve détaillée^[3], celle-ci a néanmoins été vérifiée formellement dans son intégralité à l'aide de l'assistant de preuve Isabelle^[4].

Analyse de complexité

On commence par regarder la complexité des différentes étapes de l'algorithme :

L'étape préliminaire de tri a une complexité $O(n\log n)$ (en utilisant par exemple le tri fusion) et n'est exécutée que deux fois.

La partition de l'ensemble de points par une droite verticale nécessite le parcours des $\left\lfloor {\frac {n}{2}}\right\rfloor$ premières valeurs de $T_{x}$ , c'est-à-dire $O(n)$ opérations.

À chaque appel récursif, partage les tableaux $T_{x}$ et $T_{y}$ en deux sous-tableaux ne contenant que les points des sous-ensembles considérés. Cette découpe peut être effectuée avec une complexité $O(n)$ à chaque fois^[3].

L'étape de combinaison des résultats effectue au plus $7n$ calculs de distance et a donc une complexité $O(n)$ ^[3].

La complexité ${\mathcal {C}}(n)$ de l'algorithme vérifie donc la relation de récurrence ${\mathcal {C}}(n)=2{\mathcal {C}}\left({\frac {n}{2}}\right)+O(n)$ . Par conséquent l'arbre des appels récursifs de l'algorithme est un arbre binaire qui comporte $\log n$ étages, et chaque étage a une complexité $O(n)$ . Ainsi, par le master theorem, l'algorithme est en $O(n\log n)$ ^[3].

Minoration de la complexité

On sait aussi que tout algorithme nécessite Ω(n log n) étapes de calcul pour trouver deux points les plus rapprochés^[2].

Optimisation sous certaines hypothèses

Si on suppose que la fonction partie entière est calculable en temps constant, alors le problème se résout en O(n log log n)^[5]. Si on s'autorise des algorithmes probabilistes (et la fonction partie entière calculable en temps constant), alors le problème se résout en O(n) en espérance^[6]^,^[7].

Algorithme en dimension supérieure

L'algorithme diviser pour régner se généralise à toute dimension d, avec une complexité de O(n log n) à dimension fixée, mais avec une dépendance exponentielle en la dimension^[8].

Applications

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Ce problème de recherche est utilisé par les contrôleurs aériens pour repérer les avions les plus proches les uns des autres (l'espace considéré est ici à 3 dimensions), et ainsi prévenir le risque de collision^[3].

Histoire

L'algorithme de Michael O. Rabin pour ce problème est l'un des premiers algorithmes géométriques probabilistes^[9].

Notes et références

Notes

références

↑ (en) M. I. Shamos et D. Hoey, « Closest-point problems », , 16th Annual Symposium on Foundations of Computer Science, 1975,‎ 1^er octobre 1975, p. 151–162 (DOI 10.1109/SFCS.1975.8, lire en ligne, consulté le 25 mars 2016)
↑ ^{a et b} (en) « Computational Geometry - An Introduction | Franco P. Preparata | Springer », sur www.springer.com (consulté le 25 mars 2016)
↑ ^{a b c d e f g h i j et k} Thomas H. Cormen, Charles E. Leiserson et Ronald L. Rivest, Introduction à l'algorithmique, Paris, Dunod, 2002, xxix+1146 (ISBN 978-2-10-003922-7, SUDOC 068254024), « Géométrie algorithmique »
↑ ^{a et b} (en) Martin Rau et Tobias Nipkow, « Verification of Closest Pair of Points Algorithms », Lecture Notes in Computer Science (en),‎ 24 juin 2020 (lire en ligne), disponible en accès libre.
↑ (en) S. Fortune and J.E. Hopcroft. "A note on Rabin's nearest-neighbor algorithm." Information Processing Letters, 8(1), pp. 20—23, 1979
↑ (en) S. Khuller and Y. Matias. A simple randomized sieve algorithm for the closest-pair problem. Inf. Comput., 118(1):34—37,1995
↑ (en) Richard Lipton, « Rabin Flips a Coin », 24 septembre 2011
↑ (en) Subhash Suri, « Closest Pair Problem », UC Santa Barbara
↑ (en) Rajeev Motwani et Prabhakar Raghavan, Randomized Algorithms, Cambridge, New York et Melbourne, Cambridge University Press, 1995 (réimpr. 1997, 2000), 1^re éd., 476 p. (ISBN 978-0-521-47465-8, lire en ligne), chap. 9, p. 273

[1] (en) M. I. Shamos et D. Hoey, « Closest-point problems », , 16th Annual Symposium on Foundations of Computer Science, 1975,‎ 1^er octobre 1975, p. 151–162 (DOI 10.1109/SFCS.1975.8, lire en ligne, consulté le 25 mars 2016)

[:0-2] {a et b} (en) « Computational Geometry - An Introduction | Franco P. Preparata | Springer », sur www.springer.com (consulté le 25 mars 2016)

[Cormen-3] {a b c d e f g h i j et k} Thomas H. Cormen, Charles E. Leiserson et Ronald L. Rivest, Introduction à l'algorithmique, Paris, Dunod, 2002, xxix+1146 (ISBN 978-2-10-003922-7, SUDOC 068254024), « Géométrie algorithmique »

[rau-4] {a et b} (en) Martin Rau et Tobias Nipkow, « Verification of Closest Pair of Points Algorithms », Lecture Notes in Computer Science (en),‎ 24 juin 2020 (lire en ligne), disponible en accès libre.

[fh-5] (en) S. Fortune and J.E. Hopcroft. "A note on Rabin's nearest-neighbor algorithm." Information Processing Letters, 8(1), pp. 20—23, 1979

[km-6] (en) S. Khuller and Y. Matias. A simple randomized sieve algorithm for the closest-pair problem. Inf. Comput., 118(1):34—37,1995

[rl-7] (en) Richard Lipton, « Rabin Flips a Coin », 24 septembre 2011

[8] (en) Subhash Suri, « Closest Pair Problem », UC Santa Barbara

[9] (en) Rajeev Motwani et Prabhakar Raghavan, Randomized Algorithms, Cambridge, New York et Melbourne, Cambridge University Press, 1995 (réimpr. 1997, 2000), 1^re éd., 476 p. (ISBN 978-0-521-47465-8, lire en ligne), chap. 9, p. 273

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]