Histogramme (imagerie numérique)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour l’article homonyme, voir Histogramme
Une image de tournesol
Et les histogrammes des 3 composantes

En imagerie numérique, l’histogramme représente la distribution des intensités (ou des couleurs) de l'image. C'est un outil fondamental du traitement d'images, avec de très nombreuses applications. Les histogrammes sont aussi très utilisés en photographie et pour la retouche d'images.

Définition[modifier | modifier le code]

Une image et son histogramme: on distingue clairement le pic lié aux blancs (neige et nuages)

Pour une image monochrome, c'est-à-dire à une seule composante, l'histogramme est défini comme une fonction discrète qui associe à chaque valeur d'intensité le nombre de pixels prenant cette valeur. La détermination de l'histogramme est donc réalisée en comptant le nombre de pixel pour chaque intensité de l'image. On effectue parfois une quantification, qui regroupe plusieurs valeurs d'intensité en une seule classe, ce qui peut permettre de mieux visualiser la distribution des intensités de l'image.

Les histogrammes sont en général normalisés, en divisant les valeurs de chaque classe par le nombre total de pixels de l'image. La valeur d'une classe varie alors entre 0 et 1, et peut s'interpréter comme la probabilité d'occurrence de la classe dans l'image. L'histogramme peut alors être vu comme une densité de probabilité[1]. Pour une image {x} en niveaux de gris codée sur L niveaux, on définit nk le nombre d'occurrences du niveau xk. La probabilité d'occurrence d'un pixel de niveau xk dans l'image est:

\ p_x(x_k) = p(x=x_k) = \frac{n_k}{n},\quad 0 \le k < L

avec n le nombre total de pixels de l'image, et px définit alors l'histogramme normalisé sur [0,1].

On définit également l'histogramme cumulé, somme partielle des probabilité d'occurrence :

P(x_k)=\sum_{j=0}^k p_x(x_j)

Il peut s'interpréter comme la fonction de répartition associée à la variable aléatoire {x}.

Pour les images couleurs, on peut considérer les histogrammes des 3 composantes indépendamment, mais cela n'est en général pas efficace[2]. On construit plutôt un histogramme directement dans l'espace couleur. Les classes de l'histogramme correspondent désormais à une couleur (ou un ensemble de couleurs, en fonction de la quantification), plutôt qu'à une intensité. On parle alors parfois d'histogramme de couleur.

Un histogramme peut être construit dans n'importe quel espace de couleurs, (RVB, HSV), ou sous-ensemble de cet espace, ainsi que pour les images multispectrales ou hyperspectrales.

Il est également possible de ne calculer l'histogramme que sur une partie de l'image, de forme arbitraire, ou au voisinage d'un point. On parle alors dans ce cas d'histogramme local.

Exemple[modifier | modifier le code]

Exemple de construction d'un histogramme d'une image couleur, dans l'espace RGB, sur les composantes rouge et bleue uniquement: Chaque composante est quantifiée en quatre intervalles, ce qui donne un nombre de classes de 4^2 =16. On peut alors représenter la table suivante par un histogramme 3D, où l'axe x représente la composante bleue, l'axe y représente la composante rouge et l'axe vertical est le nombre de pixels de chaque classe. Cet histogramme n'est pas normalisé.

Rouge
Exemple histogramme.svg
0-63 64-127 128-191 192-255
Bleu 0-63 43 78 18 0
64-127 45 67 33 2
128-191 127 58 25 8
192-255 140 47 47 13

Propriétés[modifier | modifier le code]

Les histogrammes sont résistants à un certain nombre de transformations sur l'image. Ils sont invariants aux rotations et aux translations, ainsi que dans une moindre mesure aux changements de point de vue, et aux changements d'échelle[3]. Les histogrammes sont en revanche sensibles aux changements d'illumination et aux conditions d'éclairage.

Pour un histogramme normalisé, la valeur de chaque classe s'interprète comme la probabilité d'occurrence de la classe dans l'image. Un histogramme normalisé somme à 1.

Une propriété intéressante est leur facilité de calcul, puisqu'il ne s'agit que de comptage de pixels, ce qui se prête bien à une implémentation matérielle. Les histogrammes sont donc souvent utilisés pour des applications temps-réel[1].

Types d'histogrammes[modifier | modifier le code]

Histogramme pondéré[modifier | modifier le code]


Histogramme conjoint[modifier | modifier le code]

Article détaillé : Histogramme conjoint.

Histogramme intégral[modifier | modifier le code]

L'histogramme intégral est une représentation qui permet un calcul rapide d'histogrammes locaux, dans n'importe quelle région de l'image. La méthode a été proposée en 2005, et s'inspire de la représentation proposée pour les images intégrales[4].

Traitements[modifier | modifier le code]

Égalisation d'histogramme[modifier | modifier le code]

Article détaillé : Égalisation d'histogramme.
La transformation T permet d'égaliser l'histogramme et d'améliorer le contraste.

L'égalisation d'histogramme est une méthode d'ajustement du contraste d'une image qui utilise l'histogramme. Elle consiste à appliquer une transformation sur chaque pixel de l'image, et donc d'obtenir une nouvelle image à partir d'une opération indépendante sur chacun des pixels. Cette transformation est construite à partir de l'histogramme cumulé de l'image de départ.

L'égalisation d'histogramme permet de mieux répartir les intensités sur l'ensemble de la plage de valeurs possibles (0 à 255 en général pour des images 8 bits), en « étalant » l'histogramme. Théoriquement (cas continu) l'histogramme devrait même être plat (loi uniforme continue). Toutefois à cause de la discrétisation, ceci est rarement le cas[5].

L'égalisation est intéressante pour les images dont la totalité, ou seulement une partie, est de faible contraste (pixels d'intensité proches). La méthode est rapide, facile d'implémentation, et complètement automatique (i.e. pas de réglages)[5].

Spécification d'histogramme[modifier | modifier le code]

Il n'est parfois pas pertinent de chercher à obtenir un histogramme uniforme par égalisation. La spécification d'histogramme est une méthode permettant de générer une image ayant une forme d'histogramme déterminée[6].

Si l'on souhaite obtenir un histogramme de forme p_z, à partir d'une image originale à L niveaux de gris, d'histogramme p_x, alors la transformation est obtenue de la manière suivante:

La transformation par égalisation de l'image originale est donnée par

s=T(x)=(L-1)\int_{0}^x p_x(w)\, \mathrm dw

La transformation par égalisation de l'image souhaitée est

s'=G(z)=(L-1)\int_{0}^z p_z(w)\, \mathrm dw

L'égalisation de l'image originale et l'image transformée doit aboutir au même histogramme égalisé, on a donc

s=s' d'où z=G^{-1}(T(x))

L'image transformée peut donc être obtenue avec l'histogramme spécifié p_z, à partir des transformations G (obtenue à partir de p_z) et T (égalisation classique de l'image originale).

Mesures de similarité[modifier | modifier le code]

Dans de nombreuses applications, il est utile de calculer une distance (ou plus généralement une mesure de similarité/dissimilarité) entre histogrammes. Par exemple pour étudier les variations temporelles du contenu visuel dans une vidéo, ou pour trouver des images similaires à une image requête. On définit pour cela un certain nombre de distances pour mesurer si deux histogrammes sont « proches » l'un de l'autre. Soit h_1 et h_2 deux histogrammes de même taille N (i.e. avec le même nombre de classes)

  • Intersection : d(h_1,h_2)=\sum_{i=1}^{N}\min \left[ h_1(i), h_2(i) \right]
  • Corrélation : d(h_1,h_2)=\frac{\sum_{i=1}^{N} \bar h_1(i) \bar h_2(i)}{\sqrt{\sum_{i=1}^{N}\bar h_1(i)^2 \sum_{i=1}^{N}\bar h_2(i)^2}}, où \bar h(i)=h(i)-\frac{1}{N}\sum_{i=1}^{N}h(i).
  • Chi-2 : d(h_1,h_2)=\sum_{i=1}^{N}\frac{ \left[ h_1(i)-h_2(i) \right]^2}{h_1(i)+h_2(i)}

De nombreuses autres mesures sont possibles, notamment la divergence de Kullback-Leibler et la distance de Bhattacharyya, puisque la comparaison d'histogrammes se ramène à une mesure de dissimilarité entre deux distributions de probabilités.

Applications[modifier | modifier le code]

L'histogramme est un outil de base du traitement d'images et est utilisé dans de très nombreuses applications et méthodes[1].

Rehaussement d'images[modifier | modifier le code]

L'égalisation d'histogramme, qu'il soit global, ou appliqué de manière local, est un outil très utilisé pour l'amélioration du contraste, et donc le rehaussement. De même, la spécification d'histogramme peut être utilisée pour le rehaussement.

Il est également possible d'utiliser les statistiques de l'histogramme (moyenne, variance) pour l'amélioration de l'intensité et du contraste[7].

Segmentation en plans[modifier | modifier le code]

Article détaillé : Segmentation en plans.
Variations de la distance entre histogrammes successifs sur une vidéo

Une segmentation en plans consiste à détecter les différents plans d'une vidéo. Pour cela, une méthode consiste à calculer un histogramme pour toutes les images de la vidéo, et d'étudier ensuite les variations temporelles des distances entre histogrammes consécutif. Une distance faible étant synonyme de similarité visuelle, et une distance élevé reflétant un fort changement visuel. Les changements de plans sont alors détectés comme étant les pics de ces variations temporelles.

Les histogrammes sont la méthode privilégiée pour la segmentation, qui donne les résultats parmi les plus robustes, tout en étant de faible complexité[8].

Reconnaissance d'objets[modifier | modifier le code]

L'idée a été proposée par Michael Swain et Dana Ballard en 1991[9] et est principalement utilisée dans les situations où, la rapidité du traitement de l'image est un facteur déterminant du choix de l'algorithme ou est un objet spécifique, au lieu d'être une classe d'objets abstraite qui requiert d' être identifiée ; telle que notée par Swain et Ballard : « Cela peut ne pas être utile pour modéliser une tasse de café étant rouge ou blanche, mais peut être utile pour vous.»

Ceci fournit une vue d'ensemble bien plus compacte des données dans une image que de savoir la valeur exacte de chaque pixel. L'histogramme de couleurs d'une image est invariable selon la translation ou de la rotation de l'axe de vue, et varie progressivement selon l'angle de vue. Ce qui fait que l'histogramme de couleurs est un outil particulièrement intéressant pour la reconnaissance d'objets ayant une position et une rotation inconnue par rapport à la scène.

L'inconvénient principal de cet histogramme est que la représentation obtenue dépend seulement de la couleur de l'objet étudié, par ce fait il n'y a pas de moyen de distinguer la différence entre une tasse rouge et blanche d'une autre tasse blanche et rouge. En d'autres termes, l'algorithme de l'histogramme de couleurs n'a pas d'idée générale de la tasse, seulement de son nombre de couleurs, alors on ne peut la comparer avec une tasse bleue et blanche, car les informations obtenues ne seront pas semblables.

Suivi d'objets[modifier | modifier le code]

Photographie[modifier | modifier le code]

L'histogramme est un outil utile pour beaucoup de photographes. Il permet notamment de savoir très rapidement s'il existe des zones bouchées (noir complet) ou brûlées (blanc pur) dans la photographie. L'histogramme permet de contrôler la qualité de l'exposition de manière objective[10]. C'est toutefois une vision théorique des choses : il est impossible à un histogramme ne comportant qu'un nombre très limité de points d'affichage de rendre compte des valeurs de tous les pixels d'une photographie en comportant des millions. Cette méthode n'est pas fiable pour exposer correctement car, en photo numérique, il importe avant tout de garder des détails dans les tons clairs[11]. Pour vérifier s'il existe des zones de l'image surexposées le seul moyen vraiment efficace sur le terrain est la fonction de clignotement des zones écrêtées disponible sur la plupart des reflex numériques et certains autres modèles.

Il est important de considérer que l'histogramme peut être analysé correctement quel que soit l'écran utilisé et ses réglages, alors que la lecture d'une image seule ne sera pas juste si l'écran utilisé n'est pas bien calibré. L'histogramme est un moyen de vérifier certaines informations juste après la prise de vue.

Bibliographie[modifier | modifier le code]

  • (en) Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing, Pearson Prentice Hall,‎ 2008
  • (en) Anil K. Jain, Fundamentals of Digital Image Processing, 1989.

Notes et références[modifier | modifier le code]

Sur les autres projets Wikimedia :

  1. a, b et c Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 120
  2. Gonzalez, Woods (2008), Color Image Processing p. 438
  3. MJ Swain, DH Ballard: Color Indexing, International Journal of Computer Vision, 1991, p. 13
  4. Porikli, F., "Integral Histogram: A Fast Way to Extract Histograms in Cartesian Spaces", proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2005
  5. a et b Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 127
  6. Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 128-138
  7. Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 140-144
  8. (en) John S. Boreczky and Lawrence A. Rowe, « Comparison of video shot boundary detection techniques », Storage and Retrieval for Image and Video Databases (SPIE), 1996.
  9. MJ Swain, DH Ballard: Color Indexing, International Journal of Computer Vision, 1991
  10. Chasseur d'Images, n° 328, novembre 2010, p. 112
  11. Scott Kelby, Zoom sur la photo numérique, Pearson,‎ 2009 (ISBN 978-2-7440-9289-3), p. 177