Aller au contenu

Archive.today

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 10 février 2022 à 18:39 et modifiée en dernier par 34 super héros (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Logo de Archive.today

Adresse Site officiel
Publicité non
Type de site Archivage web
Langue anglais
Inscription non
Lancement 2012
État actuel actif

Archive.today (anciennement archive.is) est un site dont le but est d'archiver des pages web et dont le centre de données est situé en France, dans le Nord-Pas-de-Calais. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Particularité

Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[1]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.

Références

  1. (en) « Comparison of web archiving services », sur dandascalescu.com/, (consulté le ).

Voir aussi

Articles connexes

Liens externes