Wikipédia:Télécharger la base de données
Wikipédia offre des exemplaires gratuits de son contenu, en fonction des intérêts des utilisateurs. Ces bases de données peuvent être utilisées pour effectuer un site miroir, une utilisation personnelle, des sauvegardes informelles, des requêtes ou une base de données. Tout le texte contenu est sous la licence de documentation libre GNU (GFDL). Les images et autres fichiers médias sont disponibles sous des termes différents, tel indiqué sur leurs pages de description[1]. Pour des conseils sur notre respect de ces licences, voir Wikipédia:Droit d'auteur.
Des sites externes proposent aussi le téléchargement du seul contenu des articles, destiné à être utilisé directement hors ligne.
Sommaire |
[modifier] Où la trouver ?
- Sauvegarde de tout projet de la Fondation Wikimedia : http://download.wikimedia.org/
- Wikipedia en français dans le format SQL et XML : http://download.wikimedia.org/frwiki/
- pages-articles.xml.bz2 - révisions courantes, sans les autres espaces de noms. (c'est probablement celle que vous voudrez)
- pages-current.xml.bz2- révisions courantes, toutes les pages.
- pages-full.xml.bz2/7z - révisions courantes, toutes les pages, (y compris les pages d'utilisateur et de discussion)
- pages-meta-history.xml.bz2 - toutes les révisions, toutes les pages.
- abstract.xml.gz - page résumés.
- all_titles_in_ns0.gz - les titres des article uniquement.
- fichiers SQL pour les pages et les liens sont également disponibles
- Attention : Certaines sauvegardes sont peut-être incomplètes - portez attention aux mises en garde de type « Dump complete, 1 item failed » près du fichier.
- Pour télécharger un sous-ensemble de la base de données au format XML, comme une catégorie spécifique ou une liste d'articles, voir Special:Exporter, dont l'utilisation est décrite à Aide:Export.
- Télécharger le logiciel Wiki : MediaWiki.
- Base de données du logiciel : MySQL.
- Téléchargement des images : Voir ci-dessous.
[modifier] Images et médias téléchargés en amont
Contrairement à la plupart des articles en texte, les images ne sont pas nécessairement sous licence GFDL. Elles sont peut-être aussi sous l'une des nombreuses licences libres, dans le domaine public, considérées comme usage loyal (fair use), ou encore sous droit d'auteur (qui devraient être supprimées). L'utilisation de l'usage loyal des images en particulier en dehors du contexte de Wikipedia ou des ouvrages semblables peut être illégale. Les images sous la plupart des licences requièrent un crédit, une paternité et éventuellement d'autres informations sur le droit d'auteur jointes aux fichiers. Ces informations sont incluses dans les pages description des images, qui font partie du texte de sauvegarde disponible à download.wikimedia.org. En conclusion, télécharger ces images est à vos propres risques (juridique).
[modifier] Kiwix
Kiwix est un lecteur hors-ligne pour contenus issus du Web qui fonctionne sour MacOSX, GNU/Linux et Windows. Il a été conçu pour rendre accessible Wikipédia lorsqu'il n'y a pas d'accès à Internet. Kiwix est une sorte de mini-navigateur qui au lieu d'aller sur le Web, lit des fichiers ZIM, un format de fichier contenant des pages web super compressées.
Voici les principales fonctionnalités :
- Interface simple et disponible en plus de 80 langues
- Moteur de recherche dans le texte insensible à la casse comme aux caractères accentués
- Système de suggestions pour la recherche
- Gestionnaire intégré de contenus/téléchargements
- Gestionnaire d'onglets
- Export des articles en PDF et HTML
- Gestionnaire intégré de Notes et de signets
- Mode serveur HTTP
- Pure lecteur ZIM (capable de lire directement des fichiers ZIM)
- Capable d'indexer les fichier ZIM pour la recherche dans le texte
Voir aussi :
- (fr) Kiwix + Wikipédia - torrent (~14GB)
- (fr) Fichiers ZIM de Wikipédia en différentes langues
- (fr) (en) (es) Site Web officiel
- RSS/Atom Planet
- (en) Derniers développements...
[modifier] Voir aussi
[modifier] Articles connexes
- (fr) Special:Exporter
- (fr) Aide:Export
- (fr) Aide:Import
- (fr) Manuel d'installation de MediaWiki
- (en) Downloading pages
- (en) Data dumps
[modifier] Liens externes
- Okawix logiciel de consultation de l'intégralité des projets de la Fondation.
- Kiwix logiciel de consultation de l'intégralité des projets de la Fondation. Wikipedia+Imagettes+Kiwix pour Windows (~11Go)
- (en) Wikipedia Offline est une application commerciale contenant 2 600 000 articles avec un logiciel d'aide pour la recherche hors-ligne et l'affichage de contenu de Wikipédia.
- (en) WikiTaxi
- (en) Wisigoth
- (en) BzReader
[modifier] Notes
- À propos des licences pour un complément d'information sur Commons.