Liens rompus

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Les liens rompus correspondent aux hyperliens qui dirigent les internautes vers des pages, serveurs ou autres ressources définitivement indisponibles. À plus grande échelle, le phénomène correspond au détissage de la Toile, connu en anglais sous le nom de link rot.

L'erreur HTTP 404 est bien connue par presque tous les internautes. Un nombre d'études ont examiné la prévalence de lien rompus sur la Toile, parmi la littérature académique et les bibliothèques numériques. En 2003, l'expérience faite par Fetterly et autres découvrit que chaque semaine environ un lien sur 200 cessait d'être valide. McCown et autres[1] découvrit que la moitié d'adresses URL citées dans le magazine D-Lib n'étaient plus accessibles 10 ans après leur parution, et d'autres études ont démontré que le détissage parmi les œuvres académiques atteignit des niveaux même pires [2]. Nelson et Allen (2002) examinèrent le détissage dans les bibliothèques numériques et trouvèrent que 3% d'objets ne furent plus accessibles après une année.

Un lien peut rompre (ou se détisser) pour plusieurs raisons. L'explication la plus simple et plus courante est que la page web n'existe plus, ce qui mène, dans la plupart de temps, à une erreur HTTP 404, qui indique que le serveur a bien répondu mais que la page précise est introuvable.

Références[modifier | modifier le code]

  1. McCown, F., Chan, S., Nelson, L.M., & Bollen, J. (2001). The availability and persistence of web references in D-Lib Magazine. disponible à: http://www.iwaw.net/05/papers/iwaw05-mccown1.pdf (accessed 20 November 2010)
  2. Spinellis, 2003, Lawrence et al., 2001