Structural Similarity

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Structural SIMilarity ou SSIM est une mesure de similarité entre deux images numériques.

Description[modifier | modifier le code]

Elle a été développée pour mesurer la qualité visuelle d'une image compressée, par rapport à l'image originale. L'idée de SSIM est de mesurer la similarité de structure entre les deux images, plutôt qu'une différence pixel à pixel comme le fait par exemple le PSNR. L'hypothèse sous-jacente est que l'œil humain est plus sensible aux changements dans la structure de l'image.

La métrique SSIM est calculée sur plusieurs fenêtres d'une image. La mesure entre deux fenêtres x et y de taille NxN est :

\mathit{SSIM}(x,y) = \frac{(2\mu_x\mu_y + c_1)(2cov_{xy} + c_2)}{(\mu_x^2 + \mu_y^2 + c_1)(\sigma_x^2 + \sigma_y^2 + c_2)}

avec

  • \mu_x la moyenne de x ;
  • \mu_y la moyenne de y ;
  • \sigma_x^2 la variance de x ;
  • \sigma_y^2 la variance de y ;
  • cov_{xy} la covariance de x et y ;
  • c_1 = (k_1L)^2, c_2 = (k_2L)^2 deux variables destinées à stabiliser la division quand le dénominateur est très faible ;
  • L la dynamique des valeurs des pixels, soit 255 pour des images codées sur 8 bits ;
  • k_1 = 0,01 et k_2 = 0,03 par défaut.

Pour l'évaluation de qualité d'une image, la formule précédente est appliquée sur la luminance uniquement. Typiquement, les grandeurs sont calculées sur des fenêtres de taille 8x8. La fenêtre courante peut se déplacer pixel par pixel sur l'ensemble de l’image. Cependant, les auteurs proposent de ne considérer qu'un sous-ensemble de ces fenêtres, par exemple en réduisant leur nombre d’un facteur deux dans les deux dimensions. Ceci permet de diminuer la complexité du calcul.

Structural dissimilarity (DSSIM) est une métrique dérivée de SSIM, elle est donnée par la formule suivante :

\mathit{DSSIM}(x,y) = \frac{1 - \mathit{SSIM}(x, y)}{2}

Discussions sur les performances[modifier | modifier le code]

Des articles de recherche comme "A comprehensive assessment of the structural similarity index" par Richard Dosselmann et Xue Dong Yang montrent que SSIM est en réalité peu précis (beaucoup moins précis qu'annoncé) et que SSIM fournit des notes qui ne sont pas plus corrélées avec le jugement humain que l'erreur quadratique moyenne.

De plus, bien que SSIM prétende reproduire la perception visuelle humaine, sa formule montre qu'elle ne contient aucune modélisation élaborée du système visuel humain (SVH) et SSIM se base même sur des calculs non-perceptuels. Par exemple, le système visuel humain ne calcule pas de produit entre les valeurs moyennes des deux images.

Enfin, SSIM est conçu comme une mesure de qualité d'images fixes. SSIM ne contient aucun paramètre lié aux aspects temporels de la perception visuelle humaine et du jugement humain. Pourtant, certains[Qui ?] utilisent SSIM pour mesurer la qualité de vidéos.

Notes et références[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Sources[modifier | modifier le code]

  • (en) Z. Wang, A. C. Bovik, H. R. Sheikh and E. P. Simoncelli, "Image quality assessment: From error visibility to structural similarity," IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600-612, avril 2004.
  • (en) Loza et al., "Structural Similarity-Based Object Tracking in Video Sequences", Proceedings of the 9th International Conference on Information Fusion.
  • (en) Richard Dosselmann and Xue Dong Yang "A comprehensive assessment of the structural similarity index", http://link.springer.com/article/10.1007%2Fs11760-009-0144-1#page-1, DOI 10.1007/s11760-009-0144-1

Article connexe[modifier | modifier le code]

Liens externes[modifier | modifier le code]