Transformée généralisée de Hough

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

La transformée généralisée de Hough est une technique de reconnaissance de formes utilisée pour le traitement d'images numériques. Développée en 1972 par R. Duda et P. Hart, elle permet d'étendre le principe de la transformée de Hough pour des formes quelconques (i.e. sans représentation analytique simple).

Principe[modifier | modifier le code]

La transformée généralisée de Hough fonctionne sur le même principe que la transformée de Hough : on recherche la présence d'une courbe, caractérisée par un certain nombre de paramètres ; chaque point de l'image analysée « vote » pour l'ensemble des jeux de paramètres générant des courbes auxquelles il appartient. La présence d'une courbe recherchée est caractérisée par un jeu de paramètres ayant un score élevé.

Algorithme[modifier | modifier le code]

Considérons une forme qui n'est pas définie par une équation cartésienne ou paramétrique. Elle est définie par un ensemble de points de contour (xi, yi).

Caractérisation de la forme recherchée[modifier | modifier le code]

Dans l'image enregistrée, la forme peut être à un endroit quelconque et selon une orientation quelconque. On choisit donc une position de référence et pour cette position, un point de référence (xc, yc). Puis, pour chaque point i de la forme, on détermine :

  • les coordonnées cartésiennes dans le repère d'origine (xc, yc) : x'i = xixc, y'i = yiyc
  • les coordonnées polaires (ρi, θi) par rapport au repère d'origine (xc, yc) ;
  • on détermine l'angle αi = π – θi ; on a donc :

    et
  • l'angle que fait la tangente du contour (donc la perpendiculaire au gradient de contraste) avec l'axe des x, φi ;
  • on crée une table, appelée « table R » (anglais : R-table), qui liste les couples (ρi, αi) pour chaque valeur de φ.

On crée une table R par forme recherchée.

Recherche de la forme dans la même orientation et taille[modifier | modifier le code]

Nous supposons dans un premier temps que la forme a la même orientation et la même taille que la référence.

Pour chaque point de contour détecté sur l'image, on détermine l'angle φ de la perpendiculaire au gradient de contraste avec l'axe des x. Puis, dans la table R, on extraie tous les couples (ρ(φ), α(φ)) et pour chaque couple, on détermine le point (xc, yc) correspondant. La matrice d'accumulation est incrémentée pour ces positions (xc, yc).

On transforme donc chaque point de contour détecté sur l'image en un nuage de points dans l'espace des centres (xc, yc) et on retient comme candidats les zones ayant une forte densité de centre possibles.

Recherche dans le cas général[modifier | modifier le code]

Dans le cas général, la forme peut subir une similitude directe, composée d'une homothétie (changement de taille), d'une rotation (changement d'orientation) et d'une translation (changement de place) ; nous n'avons considéré précédemment que les translations. L'homothétie est caractérisée par un facteur s et la rotation par un angle Θ. Dans le repère centré sur la position (xc, yc) de référence, le point (xi', yi') se transforme en point (x''i, y''i) :

et donc

Pour la recherche, on balaie également les valeurs s et Θ. La matrice d'accumulation représente donc la densité de valeurs dans l'espace (xc, yc, Θ, s).

Avantages et inconvénients[modifier | modifier le code]

Avantages :

  • concept simple ;
  • rapidité (par échantillonnage stochastique) ;
  • robustesse au bruit ;
  • aisément extensible à d'autres domaines que l'imagerie.

Inconvénients :

  • problème de l'homogénéité de l'espace, de sa quantification ;
  • problème de la preuve de convergence de l'algorithme.

Lien externe[modifier | modifier le code]

Références[modifier | modifier le code]