Sitemaps

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le protocole Sitemaps permet à un webmestre d'informer les moteurs de recherche quelles adresses d'un site web sont disponibles pour l'indexation automatique. Proposé initialement par Google, cette technologie a ensuite été adoptée par Live Search (désormais Bing), Yahoo, Ask et Exalead. Elle est également utilisée par Orange[1], Yandex[2] et Baidu[3]. Chez Bing, la soumission du fichier sitemap.xml ou sitemap.xml.gz, s'il est compressé, peut se faire au travers d'une simple requête http[4].

Il s'agit d'un plan de site (« sitemap ») compréhensible par les robots d'indexation, rédigé sous forme d'un fichier XML ou texte qui répertorie les URL d'un site permettant ainsi d'inclure des informations complémentaires sur chaque adresse, comme sa date de dernière modification, la fréquence de mise à jour et son importance par rapport aux autres adresses du site.

Cela permet donc aux moteurs de recherche d'explorer le site plus intelligemment.

Format XML et texte[modifier | modifier le code]

Google accepte deux formats pour les sitemaps qui lui sont soumises : XML et texte. Le format de fichier texte est une simple liste des pages avec une URL complète, protocole "http://" (ou "https://") inclus. Le fichier XML standard comporte outre l'URL :

  • une périodicité indicative pour les mises à jour de la page (de hourly à yearly),
  • la date de dernière mise à jour,
  • l'importance relative de la page par rapport aux autres pages du site.

Une fois le plan de site enregistré auprès de Google, par exemple, vous pouvez obtenir des statistiques quant aux recherches sur le moteur qui aboutissent à vos pages.

Tous les moteurs de recherche ne proposant pas d'interface pour soumettre directement cette liste à leur index, une autre méthode consiste à ajouter le chemin vers le sitemap dans le fichier robots.txt via la syntaxe :

Sitemap: http://www.example.org/sitemap.xml.

Gestion des langues[modifier | modifier le code]

Les instructions concernant le ciblage linguistique et géographique peuvent être incluses dans le fichier XML. Ceci est une alternative à l'utilisation des attributs hreflang sur les balises link comme présenté ci-dessous :

<link rel="alternate" hreflang="en" href="http://www.example.com/en" >
<link rel="alternate" hreflang="gr" href="http://www.example.com/gr" >

Il est possible d'utiliser une alternative en indiquant ces informations directement dans le fichier sitemap :


Références[modifier | modifier le code]

  1. « Orange - Référencement gratuit », sur referencement.ke.orange.fr (consulté le 30 octobre 2015)
  2. « Sitemap files — Webmaster — Yandex.Support », sur yandex.com (consulté le 30 octobre 2015)
  3. « 百度用户服务中心-站长平台 », sur help.baidu.com (consulté le 30 octobre 2015)
  4. Denis Szalkowski, « Soumission de votre sitemap », sur Denis Szalkowski Formateur Consultant,‎ (consulté le 30 octobre 2015)

Liens externes[modifier | modifier le code]