Internet Memory

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

43° 36′ 44″ N 1° 21′ 47″ E / 43.61222, 1.36306 ()

Internet Memory Foundation

Création 2004
Dates clés 2010 – changement du nom de la fondation de European Archive à Internet Memory
Fondateurs Voire The Board
Forme juridique Fondation à but non lucratif
Siège social Drapeau des Pays-Bas Amsterdam (Pays-Bas)
Direction Julien Masanès
Activité Archivage et préservation du Web
Site web Site officiel

Internet Memory est une fondation à but non lucratif dont le but est l'archivage du contenu Internet.

À ce titre, elle soutient des projets et de la recherche visant à la préservation et la sauvegarde de contenu multimédia.

Contexte et Histoire[modifier | modifier le code]

Le Web est le media de notre époque.

Pour preuve, son évolution et ses usages. Ainsi, de 105,244,649 sites Web en décembre de 2006 (50 millions actifs), on en dénombrait, selon NetCraft[1] en mars 2012, 644,275,754 (près de 200 millions actifs). Pour ces raisons, Internet peut être considérée comme la première source d’information de notre société et, dès lors, est une ressource clé à mettre en perspective, maintenant et dans le futur.

Pour Internet Memory, et comme son nom l'indique, ce média mérite un mémoire. Pour ce faire et afin de préserver une trace de ce déluge d’information, il est nécessaire de construire une mémoire de l’Internet, à grande échelle et ouverte à tous: large pour être utile, neutre dans son extension et respectueuse des droits de l'homme.

European Archive Foundation (EA)[modifier | modifier le code]

La Fondation European Archive, institution à but non lucratif, est une bibliothèque numérique de contenus culturels numériques. Elle offre un accès libre à ces contenus (voir 3- Les Collections) pour les chercheurs et pour tout public. Officiellement lancée lors de la Cross Media Week à Amsterdam (septembre 2006), elle doit son existence à l'association de plusieurs personnalités du Web, dont Brewster Kahle, qui a créé la fondation Internet Archive[2]et qui occupe également la place de président du Conseil de Surveillance de l'Internet Memory Foundation.

Opérant depuis Amsterdam et Paris, la fondation s’attache alors à la constitution d’une archive Web à grande échelle et d’une archive incluant des collections du domaine public, avec un accès libre.

Internet Memory Foundation (IM)[modifier | modifier le code]

En décembre 2010, la Fondation European Archive change de nom pour devenir l'Internet Memory Foundation. Ce changement souligne clairement sa mission de soutenir activement la préservation de l’Internet, au même titre qu'Internet Archive, comme un nouveau média.

En 2011, les archives d'IM comptent des dizaines de téraoctets de nouvelles données par mois et développe plusieurs technologies avec un mot d’ordre : « soutenir la croissance et l’utilisation de la mémoire de l’Internet ».

La fondation est membre de l'International Internet Preservation Consortium (IIPC)[3], elle a développé des partenariats et des collaborations, tant avec des institutions culturelles que des équipes de recherche pour mener à bien le développement et la promotion de l’archivage du Web.

Afin de cerner les problématiques liées à l’archivage du web, Internet Memory a mené en 2010 une enquête auprès de 360 institutions européennes, et ce, dans le cadre du projet européen de recherche Living Web Archives (LiWA).

Les projets collaboratifs[modifier | modifier le code]

Internet Memory est impliquée dans plusieurs projets collaboratifs en Europe, cofinancés par la Commission européenne :

  • Living Web Archives [4]est financé par la commission européenne (LiWA – projet N°216267). Les résultats de LiWA (de février 2008 à janvier 2011) tiennent dans des nouveaux outils et méthodes d’archivage Web qui rendent possible, à long terme, la création et l’utilisation d’archives Web de qualité.
  • LivingKnowledge [5]est financé par la commission européenne (LK – projet N°231126). L’objectif est d’améliorer la navigation et la recherche au sein de grands ensembles de données multimodales.
  • Longitudinal Analytics of Web Archive data [6]est financé par la commission européenne (LAWA – Projet N°258105). L’objectif majeur pour IM est, d’une part, le design et l’implémentation d’une nouvelle architecture pour des crawls à l’échelle du Web (milliards de ressources) et d’autre part, une infrastructure et des méthodes permettant l’analyse sur de grandes collections de documents hétérogènes.
  • Collect-All ARchives to COmmunity MEMories [7]est financé par la commission européenne (ARCOMEM – projet N°270239). Il vise à réduire les risques de perte de données Web irremplaçables car éphémères, à faciliter la création d’archives pertinentes et à en assurer leur préservation et leurs usages.
  • SCAlable Preservation Environments [8]est financé par la commission européenne (SCAPE – projet N°270137). L’objectif est de développer des services évolutifs pour permettre aux institutions patrimoniales de planifier et d’exécuter leur stratégie de préservation grâce à une plateforme open source qui orchestrera des flux de travail semi-automatisés adaptés à des collections numériques complexes, hétérogènes et de grande échelle.

Les outils[modifier | modifier le code]

Internet Memory utilise actuellement la version 3 d'Heritrix pour son Web crawler. Heritrix génère des ressources stockées dans un «container», le fichier ARC (format de fichier) (.Arc). Le fichier ARC a été étendu au format de fichier WARC (Web ARChive) (.ARM), qui a été approuvé comme norme internationale en juin 2009 (ISO 28500:2009).

Les collections[modifier | modifier le code]

La collection audio et vidéo[modifier | modifier le code]

À ses débuts, Internet Memory, alors European Archive, s’est investie à collecter des fonds audio et vidéo tombés dans le domaine public de la part d’institutions culturelles comme Beeld En Geluid (Fonds musical classique de plus de 800 œuvres réunissant les grands compositeurs de Mozart à Haydn en passant par Beethoven, Verdi, Mahler et autres Dvorak, Berlioz, Brahms… ) ou les archives nationales du Royaume-Uni (films informatifs du gouvernement anglais).

Ces collections sont libres de droit et disponibles à tous en téléchargement gratuit et illimité sur le site europarchive.org.

La collection sélective de sites Web[modifier | modifier le code]

Les collections sélectives et/ou thématiques se composent d’un ensemble de sites Web sélectionnés par les partenaires d’Internet Memory qui souhaitent donner un accès libre à leurs collections, entre autres :

Notes et références[modifier | modifier le code]

  1. Rapport mars 2012 NetCraft
  2. fondation Internet Archive
  3. International Internet Preservation Consortium
  4. Living Web Archives
  5. LivingKnowledge Project
  6. Longitudinal Analytics of Web Archive data, LAWA Project
  7. ARCOMEM Project
  8. SCAPE Project

Voir aussi[modifier | modifier le code]

Liens externes[modifier | modifier le code]