Aller au contenu

Archive d'Anna

Un article de Wikipédia, l'encyclopédie libre.

Logo.
Logo de l'Archive d'Anna.

Page d'accueil de L'Archive d'Anna au 30 juin 2024.
Page d'accueil de L'Archive d'Anna au 30 juin 2024.

Adresse
Description Bibliothèque de livres et articles scientifiques.
Slogan La plus grande bibliothèque vraiment ouverte de l'histoire humaine.
Commercial non
Écrit en Python, Bourne-Again shell
Publicité non
Type de site Moteur de recherche, Bibliothèque numérique, Partage de fichiers
Langue Multilingue
Inscription Facultative et gratuite.
Propriétaire Anna Archivist
Créé par Anna Archivist, Pirate Library Mirror
Lancement
Revenus Dons et adhésions.
État actuel En activité par l’intermédiaire de domaines mirroirs régulièrement modifiés et mis à jour.

L'Archive d'Anna est un moteur de recherche de bibliothèques clandestines créé par le pseudonyme Anna[1]. Elle a été fondée en réponse directe aux efforts des autorités pour fermer la Z-Library en 2022[2],[3],[4],[5]. Elle se décrit comme un projet visant à « cataloguer tous les livres existants » et à « suivre les progrès de l'humanité pour rendre tous les livres facilement disponibles sous forme numérique »[6].

L'Archive d'Anna est un miroir des bibliothèques Library Genesis, Open Library, Sci-Hub et Z-Library et a moissonné en intégralité le catalogue de la bibliothèque WorldCat ainsi que la base de données de livres numérisés Duxiu[7],[8],[9]. L'Archive d'Anna indique qu'elle n'héberge pas de documents protégés par le droit d'auteur et qu'elle indexe uniquement les métadonnées déjà accessibles au public.

Au , l'Archive d'Anna contenait 61 654 285 livres et 95 687 150 articles.

Le code et les données de l'Archive d'Anna sont totalement open source[10]. Les collections sont préservées en masse à l'aide de BitTorrent afin de rendre le site résistant aux pertes de données et aux censures. Le site propose deux manières pour télécharger les fichiers. Une disponible seulement pour les membres avec un abonnement actif qui permet de télécharger plus rapidement. Tandis que la seconde manière, disponible pour tous sans compte est plus lente et requiert la vérification du navigateur avec un CAPTCHA pour éviter le scraping[11].

En janvier 2026, l'adresse en .org est supprimé, deux nouveaux domaines sont aussitôt réservés, le .pm, et .in[12].

L'Archive d'Anna a été fondée par l'équipe d'archivistes anonymes Pirate Library Mirror en réponse directe aux efforts des autorités américaines pour fermer Z-Library en 2022[13].

Le , Anna indique sur son blog qu'elle a acquis une copie de Duxiu, une base de données de livres chinois numérisés[14]. Les données ont été publiées sans sanctions le [15]. Le est publié sur le blog officiel qu'un jalon important venait d'être franchi, toutes les données provenant de sources chinoises sont libérées[pas clair]. Un total de 25 sources différentes sont intégrés au reste du corpus[16].

En , Anna's Archive annonce avoir constitué une archive de la quasi-totalité du catalogue de Spotify, qui comprend les métadonnées de 256 millions de titres et 86 millions de fichiers audio, ce qui représente 99,6 % des écoutes sur la plateforme. Le site met cette archive en téléchargement gratuit et justifie cette action par sa mission de préservation culturelle. Spotify confirme enquêter sur cet accès non autorisé et précise qu'un tiers a contourné les protections DRM pour accéder aux fichiers audio[17],[18],[19].

Les volontaires derrière l'Archive d'Anna ont affirmé que leur objectif était de "cataloguer tous les livres existants" et de "suivre le progrès anthropique d'accessibilité envers ceux-ci de manière numérique"[20]. Ce projet a été décrit comme une continuité et une expansion d'autres librairies alternatives afin d'en créer une "version universelle" qui préserverait le plus de livres possibles. Cette position prend part dans ce qui est interprété comme une croissance d'une "culture de méfiance envers les entreprises, institutions, gouvernements et lois... qui ont peut-être débuté avec la crise financière de 2008 et les mouvements d'Occupy Wall Street" qui précédaient la décentralisation des technologies.

Anna a justifié leur opposition aux droits d'auteur sur des bases éthiques, affirmant qu'ils "pens[ent] que préserver et héberger ces fichiers est moralement juste"[21] et qu'eux et d'autres librairies tierces étaient convaincues que "l'information se veut libre"[22]. Ils suggèrent une réforme sur les droits d'auteur dans un but de sécurité nationale, en proposant que les pays de l'Ouest créent des exceptions pour le text mining afin de rester compétitifs dans la course à l'IA.

Anna cite Aaron Swartz, programmeur et activiste, comme inspiration pour le projet initial de collection[23].

États-Unis

[modifier | modifier le code]

Le , Anna's Archive aurait moissonné la plus grande base de données de métadonnées de livres au monde WorldCat. L'Archive d'Anna affirme que ce web scraping « marque une étape majeure dans le recensement de tous les livres du monde » et qu'elle leur permet de « travailler à la création d'une liste de tous les livres qui doivent encore être préservés »[24]. En réponse à ce web scraping, le site est poursuivi en justice le par OCLC, l'un des gestionnaires de WorldCat[25]. OCLC affirme que ce web scraping est le résultat de cyberattaques sur ses serveurs et que l'Archive d'Anna permet le téléchargement public des données récupérées. Lors du procès, le seul mis en cause connu nie toute implication de l'Archive d'Anna dans le moissonnage des données ou dans le piratage de WorldCat.

Selon OCLC, environ 2,2 téraoctets de données auraient été extraits de la base WorldCat à l’aide d’identifiants réservés à ses membres. L’organisation accuse le site d’avoir violé ses conditions d’utilisation et d’avoir perturbé ses systèmes, évaluant ses pertes à plus de 68 millions de dollars d’investissement en infrastructure et développement[26].

En juillet 2024, OCLC a demandé un jugement par défaut contre l’Archive d’Anna, réclamant plus de 5,3 millions de dollars de dommages et une injonction permanente interdisant tout accès futur aux données de WorldCat[27]. L’équipe des Archives d’Anna n’a pas répondu publiquement à la procédure et a continué d’opérer sous anonymat.

À la suite de cette affaire, le , le miroir .org a commencé à rediriger vers le miroir .gs[28]. Le , Anna a signalé sur son sous-reddit que le miroir .gs ne fonctionnait pas[29],[30], et qu'il fallait utiliser le miroir .se ou le nouveau miroir .li en remplacement. Le miroir .org a également cessé de rediriger.

En mars 2025, le tribunal fédéral de l’Ohio a suspendu la procédure et a transmis plusieurs questions de droit à la Cour suprême de l’État, notamment sur la légalité du scraping de données publiques et la validité des clauses contractuelles interdisant ce type d’accès sans consentement explicite[31]. Cette étape pourrait établir un précédent aux États-Unis sur la collecte automatisée de métadonnées.

En avril 2025, la seule personne mise en cause a été retirée de la procédure à la demande conjointe des parties, après avoir nié toute affiliation avec l’Archive d’Anna. Le procès se poursuit désormais uniquement contre l’entité du site elle-même[32].

Le 4 décembre 2023, l’agence italienne des télécommunications AGCOM a ordonné aux fournisseurs d’accès à Internet de bloquer l’accès à l’Archive d’Anna, à la suite d’une plainte déposée par l’Associazione Italiana Editori (AIE), représentant environ 90 % du marché éditorial italien. L’enquête des services numériques a confirmé que plusieurs ouvrages signalés par l’AIE étaient accessibles sur le site. L’opérateur du projet étant resté anonyme, les autorités ont identifié un hébergeur probable basé en Ukraine. L’ordonnance a imposé un blocage DNS sous 48 heures et a prévu une mesure dynamique visant à bloquer tout futur nom de domaine lié au site[33]. Anna a conseillé à ses utilisateurs de recourir à un VPN ou au réseau Tor pour contourner la mesure.

À la suite d'une requête de l'organisation anti-piratage BREIN, le tribunal de district de Rotterdam a décrété en mars 2024 la fermeture de l’Archive d’Anna et de Library Genesis[34]. Ces plateformes sont perçues comme des bibliothèques fantômes diffusant largement des œuvres soumises au droit d'auteur. La directive oblige les fournisseurs d'accès à Internet néerlandais à limiter l'accès aux domaines visés et prévoit un blocage dit dynamique, qui autorise l'intégration automatique de nouveaux noms de domaine ou adresses IP en cas de changement d'hébergement des sites. Google a aussi consenti à exclure les domaines ciblés des résultats de recherche consultables depuis les Pays-Bas[35].

En juillet 2025, le tribunal de commerce de Bruxelles a rendu un jugement unique en faveur de plusieurs associations professionnelles parmi lesquelles l’Adeb (Association des éditeurs belges), la SCAM (Société civile des auteurs multimédia), Copiebel (organisme de gestion collective des éditeurs francophones), Librius Gewu le GAU (Groep Algemene Uitgevers) et la VAV (Vlaamse Auteursvereniging), ordonnant le blocage de plusieurs bibliothèques numériques illégales telles que l’Archive d’Anna, Z Library, Library Genesis, OceanofPDF et l’Open Library d’Internet Archive[36]. Le verdict impose aux fournisseurs d’accès à Internet aux moteurs de recherche et aux autres intermédiaires techniques tels que les DNS les hébergeurs et les services de paiement de restreindre tout accès à ces plateformes et d’effacer leurs résultats de recherche. Il prévoit également une mesure dynamique permettant d’ajouter automatiquement tout nouveau nom de domaine ou adresse IP réapparaissant sous une autre forme afin d’assurer la permanence du blocage et d’empêcher les contournements[37]. L’exécution de la décision confiée au SPF Économie s’accompagne d’astreintes pouvant atteindre 500 000 euros en cas de non-respect[38]. Cependant, le site reste accessible en utilisant un VPN.

En octobre 2025, l’organisme allemande Clearingstelle Urheberrecht im Internet (CUII) a officialisé la restriction d’accès à l’Archive d’Anna, suite à un jugement du tribunal régional de Cologne. Cette initiative fait partie d’un projet de collaboration entre les titulaires de droits et les fournisseurs d'accès à Internet, qui vise spécifiquement les sites désignés comme « plateformes de piratage structurelles », c'est-à-dire des services diffusant régulièrement des œuvres protégées sans permission[39]. L’ordre de blocage, rendu public seulement après sa mise en œuvre, a suscité des critiques en raison d’un manque de transparence du processus.

Au , la justice française n'a pas délibérément visé le site d'Anna, le laissant accessible par tous. En septembre 2024, la justice avait cependant ordonné le blocage d'une centaine de noms de domaine liés à Z-Library, au terme d'une bataille du SNE (Syndicat national de l'édition)[40], confirmant une première restriction prononcée en 2022[41]. Cette interdiction rend les connexions parfois difficiles au site d'Anna, qui repose sur des miroirs de la base de données du site visé par l'interdiction.

Notes et références

[modifier | modifier le code]
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Anna's Archive » (voir la liste des auteurs).
  1. (en) Manikanta Immanni, « Anna's Archive: A Search Engine for Finding Pirated Books Online », sur TechDator, (consulté le )
  2. (en) Ernesto Van der Sar, « “Anna’s Archive” Opens the Door to Z-Library and Other Pirate Libraries », (consulté le )
  3. (de) Marc Stöckel, « Z-Library: Anna’s Archive macht Schattenbibliothek durchsuchbar », sur tarnkappe.info, 19 novembre 2022 
  4. (ja) « Kaizokuban kensaku enjin "Anna’s Archive" ga sekai saidai no toshokan katarogu kara de-ta o shutoku, "sekaijū no subete no shoseki no hozon o mezasu" shisei », sur GIGAZINE,
  5. (en) Kavita Iyer, « Anna's Archive: eBooks Search Engine Emerges After Z-Library Shuts Down », sur Techworm,
  6. (en) « Anna’s Archive » [archive] (consulté le )
  7. (en) « Exclusive access for LLM companies to largest Chinese non-fiction book collection in the world » (consulté le )
  8. (ja) « 海賊版検索エンジン「Anna’s Archive」が世界最大の図書館カタログからデータを取得、「世界中のすべての書籍の保存を目指す」姿勢 - GIGAZINE », sur gigazine.net,‎ (consulté le )
  9. « Exclusive access for LLM companies to largest Chinese non-fiction book collection in the world », sur annas-archive.se (consulté le )
  10. « AnnaArchivist / annas-archive · GitLab », sur GitLab (consulté le )
  11. « Frequently Asked Questions (FAQ) - Anna’s Archive », sur annas-archive.org (consulté le )
  12. Korben, « Anna's Archive perd son domaine en .org mais reste debout », sur Le site de Korben, (consulté le )
  13. (en) « "Anna's Archive" Opens the Door to Z-Library and Other Pirate Libraries * TorrentFreak » (consulté le )
  14. « Exclusive access for LLM companies to largest Chinese non-fiction book collection in the world », annas-archive.org (consulté le )
  15. AnnaArchivist, « We've released (without embargoes) 200TB of the DuXiu collection. We need your help seeding this, to preserve these books forever! », r/Annas_Archive, (consulté le )
  16. « We finished the Chinese release », annas-archive.org (consulté le )
  17. (en) Mitchell Peters, « Spotify Music Library Scraped by Pirate Activist Group » Accès libre, sur Billboard, (consulté le )
  18. « Pour "préserver le savoir et la culture de l’humanité", un groupe d’activistes a "sauvegardé Spotify", en aspirant 86 millions de ses morceaux, désormais téléchargeables, sans DRM » Accès libre, sur BFM TV, (consulté le )
  19. Geoffroy Ondet, « Spotify se fait voler 300 To de musique désormais téléchargeable en Torrent » Accès libre, sur 01net, (consulté le )
  20. (en-US) « Free Z-Library E-Book Download Search Engine "Anna's Archive" Launches Amid Arrests - LA Weekly », (consulté le )
  21. Elizaveta Kozina et Christian Toson, « Anna, the Universal Library », La Rivista di Engramma, vol. 2025, no 222,‎ (DOI 10.25432/1826-901X/2025.222.0032, lire en ligne, consulté le )
  22. (en-US) Claire Woodcock, « ‘Shadow Libraries’ Are Moving Their Pirated Books to The Dark Web After Fed Crackdowns », sur VICE, (consulté le )
  23. « Frequently Asked Questions (FAQ) - Anna’s Archive », sur annas-archive.li (consulté le )
  24. (en) « Anna's Archive Scraped WorldCat to Help Preserve 'All' Books in the World * TorrentFreak » (consulté le )
  25. (en) Ernesto Van der Sar, « Lawsuit Accuses Anna's Archive of Hacking WorldCat, Stealing 2.2 TB Data », sur TorrentFreak, 7 février 2024 
  26. « Lawsuit Accuses Anna's Archive of Hacking WorldCat, Stealing 2.2 TB Data * TorrentFreak », sur torrentfreak.com (consulté le )
  27. « Anna's Archive Faces Millions in Damages and a Permanent Injunction * TorrentFreak », sur torrentfreak.com (consulté le )
  28. « Anna’s Archive », sur web.archive.org, (consulté le )
  29. (en) « Anna's Archive Loses .GS Domain Name But Remains Resilient * TorrentFreak » (consulté le )
  30. AnnaArchivist, « We've been having issues with our .gs domain. Please use .se or .li instead. We've also refreshed our search index with new files, enjoy! », sur r/Annas_Archive, (consulté le )
  31. « Anna's Archive Scraping: Court Defers Key Questions to State Supreme Court * TorrentFreak », sur torrentfreak.com (consulté le )
  32. « Alleged Anna's Archive Operator Dropped from U.S. 'Scraping' Lawsuit * TorrentFreak », sur torrentfreak.com (consulté le )
  33. « Silenzio! 'Anna's Archive' Shadow Library Blocked Following Publishers' Complaint * TorrentFreak », sur torrentfreak.com (consulté le )
  34. (nl) brein, « Blokkering shadow libraries bevolen », sur BREIN, (consulté le )
  35. « Dutch Court Orders ISP to Block 'Anna's Archive' and 'LibGen' * TorrentFreak », sur torrentfreak.com (consulté le )
  36. « LibGen, Z-Library, Anna’s Archive… condamnés en Belgique pour piratage de livres », sur ActuaLitté.com (consulté le )
  37. « Belgium Targets Internet Archive's 'Open Library' in Sweeping Site Blocking Order (Update) * TorrentFreak », sur torrentfreak.com (consulté le )
  38. « Belgique : “une mobilisation inédite par son ampleur” face au piratage », sur ActuaLitté.com (consulté le )
  39. « German Pirate Site Blockades Target Anna's Archive, FitGirl and RPG Only * TorrentFreak », sur torrentfreak.com (consulté le )
  40. « Z-Library : la justice ordonne le blocage du site de téléchargement illégal », Le Monde,‎ (lire en ligne, consulté le )
  41. « Le SNE obtient, selon la procédure accélérée au fond, le blocage du site Z-library par les fournisseurs d’accès à internet - Droit d'auteur », sur www.legipresse.com (consulté le )

Articles connexes

[modifier | modifier le code]

Liens externes

[modifier | modifier le code]