Distance (mathématiques)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Distance.

En mathématiques, une distance est une application qui formalise l'idée intuitive de distance, c'est-à-dire la longueur qui sépare deux points. C'est par l'analyse des principales propriétés de la distance usuelle que Fréchet introduit la notion d'espace métrique, développée ensuite par Hausdorff. Elle introduit un langage géométrique dans de nombreuses questions d'analyse et de théorie des nombres[1].

À partir de la définition d'une distance, vue comme une application satisfaisant à certains axiomes, d'autres notions de distance peuvent être définies, comme la distance entre deux parties, ou la distance d'un point à une partie, sans que ces dernières répondent à la définition première d'une distance.

Définition[modifier | modifier le code]

En mathématiques, on appelle distance sur un ensemble E une application d définie sur le produit E2 = E×E et à valeurs dans l'ensemble ℝ+ des réels positifs[2],

d :E\times E\to\R^+

vérifiant les propriétés suivantes :

Nom Propriété
symétrie \forall (a,b)\in E^2,\ d(a,b)=d(b,a)
séparation \forall (a,b)\in E^2,\ d(a,b)=0 \Leftrightarrow a=b
inégalité triangulaire \forall (a,b,c)\in E^3,\ d(a,c)\leq d(a,b)+d(b,c)

Un ensemble muni d'une distance s'appelle un espace métrique.

Propriétés simples[modifier | modifier le code]

  • Si E est un sous-ensemble de F et si d : F×F+ est une distance sur F, alors la restriction de d à E×E est une distance sur E.
  • Si d1 et d2 sont respectivement des distances sur E1 et E2 et si F est le produit E1×E2, alors l'application d : F×F+ définie pard((a_1,a_2),(b_1,b_2))=d_1(a_1,b_1)+d_2(a_2,b_2)est une distance sur F. (Pour des généralisations, voir Produit d'espaces métriques.)
  • Si d1 et d2 sont des distances sur E alors d1 + d2 aussi (d'après les deux points précédents, en identifiant E à la diagonale de E×E).

Cas particuliers[modifier | modifier le code]

Distance ultramétrique[modifier | modifier le code]

Article détaillé : Distance ultramétrique.

La distance est dite ultramétrique si de plus :

Nom Propriété
Ultramétrie \forall a,b,c\in E: d(a,c)\leq \max( d(a,b), d(b,c) ).

Un exemple de telle distance intervient de façon cruciale dans la théorie des valuations p-adiques. L'interprétation géométrique de l'inégalité triangulaire dans un espace ultramétrique amène à dire que tous les triangles sont isocèles ; de plus, toutes les boules de rayon donné définies sur cet ensemble constituent une partition de cet ensemble ; en faisant croître ce rayon depuis 0, l'espace se trouve doté d'une structure hiérarchique de proximité, utilisable en classification automatique, en particulier pour le clustering hiérarchique.

Exemples de distances classiques[modifier | modifier le code]

Distance sur des espaces vectoriels[modifier | modifier le code]

Distance de Manhattan (chemins rouge, jaune et bleu) contre distance euclidienne en vert

Dans un espace vectoriel normé (E,\|\cdot\|), on peut toujours définir de manière canonique une distance d à partir de la norme. En effet, il suffit de poser : \forall (x,y) \in E\times E,\ d(x,y) = \|y-x\|.

En particulier, dans ℝn, on peut définir de plusieurs manières la distance entre deux points, bien qu'elle soit généralement donnée par la distance euclidienne (ou 2-distance). Soit deux points de E, (x1, x2, …,xn) et (y1, y2, …,yn), on exprime les différentes distances ainsi :

Nom Paramètre Fonction
distance de Manhattan 1-distance \sum_{i=1}^n |x_i-y_i|
distance euclidienne 2-distance \sqrt{\sum_{i=1}^n (x_i-y_i)^2}
distance de Minkowski p-distance \sqrt[p]{\sum_{i=1}^n |x_i-y_i|^p}
distance de Tchebychev -distance \lim_{p \to \infty}\sqrt[p]{\sum_{i=1}^n |x_i-y_i|^p} = \sup_{1 \leq i \leq n}{|x_i-y_i|}

La 2-distance permet de généraliser l'application du théorème de Pythagore à un espace de dimension n. C'est la distance la plus « intuitive ».

La p-distance est rarement utilisée en dehors des cas p = 1, 2 ou . L'-distance présente la particularité amusante de permettre la définition en toute rigueur de sphères cubiques (voir oxymore). La 1-distance permet de définir des sphères octaédriques.

Distance sur une sphère[modifier | modifier le code]

Article détaillé : Distance du grand cercle.

Distances entre deux permutations[modifier | modifier le code]

Il est également possible de définir des distances entre des permutations. L'exemple suivant est très utilisé dans le réarrangement de génomes. Soit S un ensemble de permutations modélisant diverses opérations ; alors la distance entre deux permutations π et σ est la longueur d'une séquence minimale formée du produit d'éléments de S telle que cette séquence transforme π en σ.

Ces distances peuvent également servir à mesurer, de diverses manières, le désordre présent dans une séquence. On utilise alors ces mesures pour analyser les performances de divers algorithmes de tri, ou pour construire de nouveaux algorithmes de tri qui effectuent un nombre de comparaisons optimal par rapport à la mesure de désordre choisie.

Distance de Levenshtein[modifier | modifier le code]

Article détaillé : distance de Levenshtein.

La distance de Levenshtein est un exemple de distance définie sur l'ensemble des chaînes de caractères. Elle est définie pour deux chaînes A et B comme le nombre minimal d'opération d'ajout/suppression/remplacement de caractères pour transformer la chaîne A en la chaîne B.

Exemples:

  • Levenshtein('BONJOUR','BONSOIR')=2 (il est nécessaire et suffisant de remplacer 'J' par 'S' et 'U' par 'I').
  • Levenshtein('DEBUT','FIN')=5
  • Levenshtein('DUNKERQUE','PERPIGNAN')=9 [3]

Ce type de distance est couramment utilisé pour des applications de filtrage/correction d'erreurs, par exemple la correction automatique pour des programmes de traitement de texte (le programme va rechercher dans un dictionnaire les mots présentant les distances les plus faibles avec le mot mal orthographié), l'appareillement de lectures optiques de plaques minéralogiques...

Il existe des variantes de cette distance, telles que la distance de Damerau-Levenshtein.

Le même principe général peut être utilisé pour les applications de reconnaissance de formes.

Exemples d'autres emplois du terme distance[modifier | modifier le code]

Le terme distance est parfois utilisé pour désigner des applications ne répondant pas à la définition classique pour les espaces métriques, présentée en début d'article.

Distance entre deux ensembles[modifier | modifier le code]

Soient E1 et E2 deux parties non vides d'un espace métrique E muni d'une distance d, on définit la distance entre ces deux ensembles comme :  d(E_1,E_2) = \inf\{ d(x,y)\mid (x,y) \in E_1 \times E_2\}.

C'est un réel positif, comme borne inférieure d'un ensemble non vide de réels positifs.

N.B.
Cette « distance » n'est pas une distance sur l'ensemble des parties de E au sens des axiomes définis plus haut. En particulier si la distance entre deux ensembles est nulle, on ne peut pas en déduire que ces ensembles sont égaux, ni même que leurs adhérences se rencontrent.

Néanmoins, il est possible de définir une vraie distance entre les parties compactes d'un espace métrique. Pour cela, voir : distance de Hausdorff.

Distance d'un point à une partie[modifier | modifier le code]

On peut particulariser la définition précédente en prenant l'un des deux ensembles réduit à un point.

Si A est une partie non vide d'un espace métrique E, et si x est élément de E, on définit la distance de x à A par :

d(x,A)= \inf \{d(x,y)\mid y \in A\}.

C'est[4] le rayon de la plus grande boule ouverte de centre x qui ne rencontre pas A.

On prendra garde au fait que d(x, A) = 0 n'implique pas en général que x soit élément de A. Par exemple, dans ℝ muni de la valeur absolue, la distance de 0 à l'intervalle ouvert ]0, 1[ est nulle, ou la distance de tout réel à l'ensemble des rationnels est nulle également.

On peut démontrer[5] plus précisément que la distance de x à A est nulle si et seulement si x est un point adhérent à A (autrement dit : l'implication précédente est vraie si et seulement si A est fermé). Plus généralement, la distance de x à A est égale à la distance de x à l'adhérence de A.

L'application de E dans ℝ qui à tout élément x de E associe d(x, A) vérifie l'inégalité triangulaire : \forall x,y \in E\quad |d(x,A)-d(y,A)| \le d(x,y). C'est donc une application continue, puisque 1-lipschitzienne.

Distance algébrique[modifier | modifier le code]

Soit deux points A et B d'un espace affine par lesquels passe une droite orientée (une droite munie d'un sens, c'est-à-dire engendrée par un vecteur \vec{v} non nul). On appelle distance algébrique de A vers B le réel tel que :

  • sa valeur absolue soit la distance (définie ci-dessus) entre A et B
  • si la valeur est non nulle :
    • le réel soit positif dans le cas où le vecteur \overrightarrow{\rm AB} est de même sens que \vec{v}, c'est-à-dire égal à k\vec{v}, avec k>0,
    • négatif sinon.

On peut démontrer que la distance algébrique de A vers B (notée d_a(\mathrm{A}, \mathrm{B})) vaut :

 d_a(\mathrm{A}, \mathrm{B}) = \frac{\overrightarrow{\mathrm{AB}}.\vec{v}}{\|\vec{v}\|}

Attention, la distance algébrique n'est pas une distance, puisqu'elle est non symétrique :

d_a(\mathrm{A}, \mathrm{B}) = - d_a(\mathrm{B}, \mathrm{A})

Voir aussi[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Jean-Luc Verley, « Espaces métriques », dans Dictionnaire des mathématiques; algèbre, analyse, géométrie, Albin Michel,‎ 1997, p. 651
  2. Dans la définition d'une distance, on demande généralement que l'ensemble d'arrivée soit ℝ+ ; on peut, sans même utiliser la séparation, se contenter de supposer que c'est ℝ et invoquer l'inégalité triangulaire (deux fois) et l'égalité de symétrie : si d(x,y) ≤ d(x,y) + d(y,x) + d(x,y) = 3 d(x,y), alors d(x,y) ≥ 0.
  3. Un calculateur en ligne: http://planetcalc.com/1721/
  4. Verley 1997, p. 653
  5. E. Ramis, C. Deschamps et J. Odoux, Mathématiques spéciales, T.3, topologie et éléments d'analyse, Masson, Paris, 1976, p. 49