Codage de Levenshtein

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 17 mars 2013 à 23:02 et modifiée en dernier par Addbot (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Le codage de Levenshtein est un codage entropique inventé par Vladimir Levenshtein en 1968 et utilisé essentiellement en compression de données.

Le code de Levenshtein produit est un code préfixe et universel.

Principe

Le codage de Levenshtein permet de coder tous les entiers naturels (zéro compris — ce qui le distingue des codes d'Elias), sans qu'il y ait besoin de connaitre au préalable l'intervalle des valeurs à coder (contrairement, par exemple, au codage binaire de taille fixe, qui ne permet de coder que des nombres inférieurs à une borne supérieure fixée à l'avance).

Pour cela, le codage de Levenshtein se fait en deux étapes :

  1. le codage du nombre de récursions de l'algorithme avec un codage unaire ;
  2. le codage récursif de la valeur.

Le codage récursif consiste à représenter l'entier en binaire, privé de son bit de poids fort (implicite) et précédé de son nombre de bits (sans compter le bit de poids fort dont il est privé), lui-même codé avec un codage récursif — la récursion s'arrêtant lorsque le nombre est nul.


Longueur du code

Un code de Levenshtein est toujours exactement un bit plus long que le code omega équivalent. À la différence de ce dernier, il permet cependant de coder les entiers relatifs sans transformation intermédiaire.

Exemples

Représentation des premiers entiers naturels (zéro compris) avec un codage de Levenshtein
Décimal Binaire Code omega Code de Levenshtein
0 0 Impossible 0
1 1 0 10
2 10 10 0 110 0
3 11 11 0 110 1
4 100 10 100 0 1110 0 00
5 101 10 101 0 1110 0 01


Voir aussi

Articles connexes