Archive.is

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Archive.is (anciennement archive.today) est un site dont le but est d'archiver des pages web et dont le centre de donnée est située dans le Nord-Pas-de-Calais. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.