Élément de lien canonique

Un article de Wikipédia, l'encyclopédie libre.

Un élément de lien canonique est un élément HTML qui aide les webmasters à éviter les problèmes de contenu dupliqué dans l'optimisation des moteurs de recherche (SEO) en spécifiant la version "canonique" ou à favoriser pour l'indexation d'une page Web. Il est décrit dans la RFC 6596[1], qui a été mise en ligne en avril 2012[2],[3].

Objectif[modifier | modifier le code]

Un problème majeur pour les moteurs de recherche est de déterminer la source d'origine des documents disponibles sur plusieurs URL. La duplication de contenu peut se produire de plusieurs manières, notamment [4]:

  • Duplication à la suite de l'utilisation de paramètres GET dans les urls
  • Duplication avec plusieurs URL à cause du CMS
  • Duplication due à l'accessibilité sur différents hôtes/protocoles (avec ou sans www, version http et https)
  • Duplication due aux versions imprimées des pages des sites Web proposant ce type de fonctionnalité

Des problèmes de contenu en double se produisent lorsque le même contenu est accessible à partir de plusieurs URL[5]. Par exemple,http://www.example.com/page.html serait considéré par les moteurs de recherche comme une page entièrement différente de http://www.example.com/page.html?parameter=1, même si les deux URL peuvent faire référence au même contenu[6],[7].

En février 2009, Google, Yahoo et Microsoft ont annoncé la prise en charge de l'élément de lien canonical, qui peut être inséré dans la section < head > d'une page Web, pour permettre aux webmasters d'éviter ces problèmes[8]. L'élément de lien canonique aide les webmasters à indiquer clairement aux moteurs de recherche quelle page doit être créditée comme l'original.

Comment les moteurs de recherche gèrent rel="canonical"[modifier | modifier le code]

Les moteurs de recherche essaient d'utiliser les balises de liens canoniques comme filtre d'analyse pour leurs résultats de recherche. Si plusieurs URL contiennent le même contenu dans le jeu de résultats, les balises d'URL de lien canonique seront probablement utilisées pour déterminer la source originale du contenu. "Par exemple, lorsque Google trouve des instances de contenu identiques, il décide d'en montrer une. Son choix de la ressource à afficher dans les résultats de recherche dépendra de la requête de recherche." [9]

D'après Google, l'élément de lien canonique rel="canonical" n'est pas une directive imposée, mais c'est clairement un indice que l'algorithme de positionnement suivra fortement[10].

Alors que l'élément de lien canonique a ses avantages, Matt Cutts, alors responsable de l'équipe de spam Web de Google, a déclaré que le moteur de recherche préférait l'utilisation de redirections 301. Cutts a déclaré que la préférence pour les redirections est due au fait que les robots d'indexation de Google peuvent choisir d'ignorer un élément de lien canonique s'ils jugent plus avantageux de le faire[11].

Implémentation technique[modifier | modifier le code]

Balise sémantique[modifier | modifier le code]

L'élément de lien canonique peut être soit utilisé dans le code HTML <head> de la page soit envoyé avec l' en-tête HTTP d'un document. Pour les documents non HTML, l'en-tête HTTP est une autre façon de définir une URL canonique[12],[13].

Selon la norme HTML 5, l'élément <link rel="canonical" href="http://example.com/"> HTML doit se trouver dans la section <head> du document[14].

Exemples[modifier | modifier le code]

HTML[modifier | modifier le code]

Voici un exemple de code HTML qui utilise la balise rel=canonical à l'intérieur de la section <head> . Le code peut être utilisé sur une page telle que https://example.com/page.php?parameter=1 pour indiquer aux moteurs de recherche que https://example.com/page.php est la version originale de la page Web.

<!DOCTYPE html>
<html>
<head>
 <link rel="canonical" href="https://example.com/page.php">
</head>
<body>
... 
</body>
</html>

HTTP[modifier | modifier le code]

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <https://example.com/page.php>; rel="canonical"
Content-Length: 4223
...

Références[modifier | modifier le code]

  1. (en) Request for comments no 6596
  2. Kupke, « Specify your canonical », Google, (consulté le )
  3. Cutts, « Learn about the Canonical Link Element in 5 minutes », (consulté le )
  4. « Link rel=canonical: How to do URL canonicalization right », Audisto GmbH (consulté le ).
  5. « Duplicate content », Google (consulté le )
  6. Biswas, « Canonical Issue and How to Use Canonical Tag – The Proper Way » [archive du ], RevenueI (consulté le )
  7. Zadro, « Rel=Canonical - A Beginners Guide to Canonical Tags - Where and When to Use Them », Zadro Web (consulté le )
  8. Fox, « Google, Yahoo & Microsoft Unite On "Canonical Tag" To Reduce Duplicate Content Clutter », Search Engine Land, (consulté le )
  9. Web Deduplication (WMConf MTV '19) from Google Search Central | https://www.youtube.com/watch?v=LsfIlviyDvE&feature=emb_title
  10. « Consolidate duplicate URLs - Search Console Help », support.google.com
  11. Cutts, « A rel [equals] canonical corner case », (consulté le )
  12. « Link rel=canonical: How to do URL canonicalization right », Audisto GmbH (consulté le )
  13. « Consolidate duplicate URLs - Search Console Help », support.google.com
  14. « HTML link tag », www.w3schools.com (consulté le )