Sitemaps

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le protocole Sitemaps permet à un webmestre d'informer les moteurs de recherche quelles adresses d'un site web sont disponibles pour l'indexation automatique. Proposé initialement par Google, cette technologie a ensuite été adoptée par Live Search (désormais Bing), Yahoo, Ask et Exalead.

Il s'agit d'un plan de site (« sitemap ») compréhensible par les robots d'indexation, rédigé sous forme d'un fichier XML ou texte qui répertorie les URL d'un site permettant ainsi d'inclure des informations complémentaires sur chaque adresse, comme sa date de dernière modification, la fréquence de mise à jour et son importance par rapport aux autres adresses du site.

Cela permet donc aux moteurs de recherche d'explorer le site plus intelligemment.

Format XML et texte[modifier | modifier le code]

Google accepte deux formats pour les sitemaps qui lui sont soumises : XML et texte. Le format de fichier texte est une simple liste des pages avec une URL complète, protocole "http://" (ou "https://") inclus. Le fichier XML standard comporte outre l'URL :

  • une périodicité indicative pour les mises à jour de la page (de hourly à yearly),
  • la date de dernière mise à jour,
  • l'importance relative de la page par rapport aux autres pages du site.

Une fois le plan de site enregistré auprès de Google, par exemple, vous pouvez obtenir des statistiques quant aux recherches sur le moteur qui aboutissent à vos pages.

Tous les moteurs de recherche ne proposant pas d'interface pour soumettre directement cette liste à leur index, une autre méthode consiste à ajouter le chemin vers le sitemap dans le fichier robots.txt via la syntaxe : Sitemap: http://www.example.org/sitemap.xml.

Liens externes[modifier | modifier le code]