Compression par ondelettes

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La compression par ondelettes est une technique de compression de données, bien adaptée à la compression d'images.

Introduction aux ondelettes[modifier | modifier le code]

Grande rivale de la DCT, la technique de compression à base d’ondelettes offre une plus grande finesse au niveau de l’analyse du signal et permet de mieux s’adapter aux propriétés locales de l’image. Il s’agit d’une voie de recherche assez prometteuse. Les codeurs JPEG 2000 et SPIHT utilisent tous deux une transformée en ondelettes dans leur schéma de compression. En revanche, seul JPEG 2000 est une norme. La compression en ondelettes est en elle-même sans pertes, c'est l'introduction d'une quantification ou d'un seuillage qui entraine la perte irréversible d'informations.

La première transformation par ondelettes est une technique inventée par Alfréd Haar en 1909, avec l'ondelette du même nom. De manière assez indépendante, les ondelettes sont utilisées sporadiquement pendant le XXe siècle. En 1984, Jean Morlet, un ingénieur français, les utilise pour la prospection pétrolière et introduit le terme même d'ondelette.

L'utilisation de cette transformation en imagerie consiste à décomposer une image en une myriade de sous-bandes, c’est-à-dire des images de résolution inférieure. La transformation en ondelettes provient d'une analyse multirésolution de l'image. On considère des espaces d'approximations de plus en plus grossiers notés V_j et des espaces "capturant" les détails perdus entre chaque niveau d'approximation notés W_j avec j \in \mathbb{Z} . Les bases ondelettes se situent sur les W_j, c'est là qu'est le cœur de la compression sans perte.

Les coefficients d'ondelettes dans les W_j mettent en évidence des informations sur les contours, les textures, leur localisation et leur orientation. Le choix de l’ondelette mère est très important et fait toujours l’objet d’expérimentations pour adapter l’analyse du signal image au système de perception visuelle de l’homme.

Algorithme ondelettes[modifier | modifier le code]

Ondelette schema de compression.png
Figure 1 : schéma de compression

La compression se compose donc des étapes suivantes :

  1. Transformations par ondelettes.
  2. Quantification : les valeurs des images de détails inférieures à un certain niveau sont éliminées, en fonction de l’efficacité recherchée. C’est cette étape qui introduit des pertes.
  3. Codage des valeurs restantes.

Transformée ondelettes[modifier | modifier le code]

Pour commencer, nous allons expliquer la transformée à une dimension.

Nous avons donc comme donnée originale :

Niveau 4 : s^4_0 s^4_1 s^4_2 s^4_3 s^4_4 s^4_5 s^4_6 s^4_7 s^4_8 s^4_9 s^4_{10} s^4_{11} s^4_{12} s^4_{13} s^4_{14} s^4_{15} = S^4

Étape après étape, nous obtenons :

Niveau 3 : s^3_0 s^3_1 s^3_2 s^3_3 s^3_4 s^3_5 s^3_6 s^3_7 d^3_0 d^3_1 d^3_2 d^3_3 d^3_4 d^3_5 d^3_6 d^3_7 = S^3, D^3

Niveau 2 : s^2_0 s^2_1 s^2_2 s^2_3 d^2_0 d^2_1 d^2_2 d^2_3 d^3_0 d^3_1 d^3_2 d^3_3 d^3_4 d^3_5 d^3_6 d^3_7 = S^2, D^2, D^3

Niveau 1 : s^1_0 s^1_1 d^1_0 d^1_1 d^2_0 d^2_1 d^2_2 d^2_3 d^3_0 d^3_1 d^3_2 d^3_3 d^3_4 d^3_5 d^3_6 d^3_7 = S^1, D^1, D^2, D^3

Nous obtenons finalement :

Niveau 0 : s^0_0 d^0_0 d^1_0 d^1_1 d^2_0 d^2_1 d^2_2 d^2_3 d^3_0 d^3_1 d^3_2 d^3_3 d^3_4 d^3_5 d^3_6 d^3_7 = S^0, D^0, D^1, D^2, D^3

Le passage d’un niveau à l’autre s’effectue, avec une ondelette de Haar, à l’aide des formules suivantes :

s_i^{k-1} = {s_{2i}^k + s_{2i + 1}^k \over 2}
d_i^{k-1} = {s_{2i}^k - s_{2i + 1}^k \over 2}
Équation 1 : Transformée ondelettes

Le premier calcul est la moyenne de deux pixels ce qui va permettre de calculer les fréquences deux fois plus basses. Le deuxième calcul est la différence entre deux pixels, ce qui correspond à l’amplitude de la fréquence à l’endroit donné. On remarque donc que la transformée DCT donne des informations sur l’amplitude des fréquences, alors que la transformée en ondelettes donne l’amplitude de la fréquence à un endroit donné. Cette dernière donne donc un rendu plus proche de la perception humaine car pour le son par exemple, on remarque s’il y a des basses ou des aigus à un instant donné. On peut également remarquer que dans le cas de la DCT, les fréquences varient de façon linéaire tandis que dans le cas de la transformée par ondelettes les fréquences varient de manière logarithmique. Ceci est également plus proche de notre perception.

Transformée ondelettes à deux dimensions[modifier | modifier le code]

On distingue 4 étapes différentes pour procéder à la transformation dans le cas très particulier de l'ondelette de Haar :

  1. Moyenner les pixels de l’image originale deux à deux suivant l’axe horizontal ; par exemple : H(x) = {X_n + X_{n+1} \over 2}
  2. Calculer l’erreur entre l’image originale et l’image sous-échantillonnées dans le sens horizontal ; par exemple : G(x) = {X_n - X_{n+1} \over 2}
  3. Pour chacune des deux images intermédiaires, moyenner les pixels deux à deux suivant l’axe vertical ; par exemple : H(y) = {Y_n + Y_{n+1} \over 2}
  4. Pour chacune des deux images intermédiaires, calculer l’erreur suivant l’axe vertical ; par exemple : G(y) = {Y_n -Y_{n+1} \over 2}

Ce qui donne graphiquement :

Ondelette par niveaux.png
Figure 2 : schéma de transformation d’un niveau à l’autre

Le résultat est une image d’approximation qui a une résolution divisée par deux et trois images de détails qui donnent les hautes fréquences de l’image originale. Cette transformation est répétée autant de fois que nécessaire pour obtenir le nombre voulu de sous-bandes.

Niveaux après niveaux nous obtenons :

Ondelette à deux dimentions.png
Figure 3 : transformée en ondelettes niveau après niveau

Décompression ondelettes[modifier | modifier le code]

La transformation inverse par ondelettes reconstruit une image originale. La construction de l’image à partir des sous-bandes restitue l’image en mode progressif. L’affichage de l’image peut s’effectuer en deux modes :

  • Soit la taille de l’image augmente au fur et à mesure de la lecture du fichier compressé.
  • Soit la résolution de l’image augmente au fur et à mesure de la lecture du fichier compressé.

Comparaison des algorithmes[modifier | modifier le code]

Les principaux avantages par rapport à JPEG sont :

  • Le fait que l’algorithme s’adapte mieux aux propriétés locales de l’image.
  • On peut atteindre des taux de compression d’environ 50 contre 15 pour JPEG tout en ayant une qualité d’image raisonnable.

Applications industrielles[modifier | modifier le code]

  • Imagerie médicale.
  • Le cinéma numérique a adopté la norme JPEG 2000, qui utilise une transformée en ondelettes.
  • Les empreintes digitales des fichiers du FBI
  • La société "Red Digital Cinéma" fabriquant des caméras Red One, Epic et Scarlet, ont développé un format de compression pour enregistrer les données "RAW" de leurs caméra, à base d'une compression par ondelettes. Le format se nomme Redcode, utilise l'extension .r3d et le taux de compression est réglable dans la caméra. L'Epic, leur caméra haut de gamme, peut utiliser des taux de compression entre 3:1 (sans pertes selon Red) à 18:1 pour des fichiers très petits.

Bibliographie[modifier | modifier le code]

Français[modifier | modifier le code]

Anglais[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Transformée en ondelettes discrète