Projet Gutenberg

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Gutenberg.

Le projet Gutenberg est une bibliothèque de versions électroniques libres (parfois appelés e-texts) de livres physiquement existants. Les textes fournis sont essentiellement du domaine public, soit parce qu'ils n'ont jamais été sous copyright, soit parce qu'il est expiré. Il y a également quelques textes sous copyright rendus disponibles par le projet avec la permission de l'auteur. Le projet fut lancé par Michael Hart en 1971 et nommé en hommage à l'imprimeur allemand du XVe siècle Johannes Gutenberg. En novembre 2013, le projet Gutenberg annonce proposer plus de 42'000 livres dans sa collection.

Information générale[modifier | modifier le code]

Le slogan du projet, « brisons les barrières de l'ignorance et de l'illettrisme », a été choisi parce que le projet espère continuer l'œuvre de répandre le lettrisme et le goût pour l'héritage littéraire, ce que commença à faire la bibliothèque publique au début du XXe siècle.

La plupart des parutions du projet Gutenberg sont en anglais. Mais il y en a maintenant un nombre significatif[1] en français[2], allemand, néerlandais, chinois, portugais, espagnol, italien, finnois, et plus de 40 autres langues.

Tous les textes du projet Gutenberg peuvent être acquis et redistribués par les lecteurs sans aucuns frais. Le projet possède la marque déposée de « projet Gutenberg » et l'utilisation commerciale des e-texts sous marque déposée requiert un droit payable au Projet. L'en-tête ôté et la marque non utilisée, le texte peut être utilisé sans restrictions (il y a quelques textes sous droit d'auteur dans le Projet, qui ont d'autres restrictions).

Le projet a fait paraître plus de 30 000[3] livres numériques, produits presque entièrement par des volontaires, et demeure en activité. La liste des livres électroniques disponibles s'enrichit peu à peu chaque jour par la contribution de correcteurs, chacun a vocation à devenir correcteur bénévole[2] en s'inscrivant sur l'un ou l'autre des sites de « distributed proofreaders », et en se portant ainsi volontaire pour la correction "page par page".

Des critiques ont été adressées envers quelques e-texts du Projet Gutenberg concernant leur manque d'érudition, par exemple, le détail insuffisant des éditions utilisées et l'omission des préfaces originelles publiées ainsi que de l'appareil critique. À cause de ces défauts, l'édition électronique n'est pas une copie fidèle d'une édition papier, et elle est inutilisable dans le cadre d'un travail universitaire. La confrontation des premiers e-texts aux nouveaux permet de constater une tendance à la meilleure préservation de tels textes ; la plupart des nouveaux textes conservent l'information et les préfaces de l'édition originale.

Histoire[modifier | modifier le code]

Le projet a été initié en 1971 par Michael Hart, à l'université de l'Illinois aux États-Unis. Ayant eu à sa disposition, grâce à des amis administrateurs, du temps de calcul sur un ordinateur mainframe estimé à l'époque valoir 100 000 000 de dollars, il chercha un moyen de rendre ce qui lui avait été donné. Il estima alors que la plus grande valeur créée par les ordinateurs n'était pas le calcul, mais le stockage, la mise à disposition et la recherche de ce qui était entreposé dans les bibliothèques. En guise de preuve de concept, il saisit une copie de la déclaration de l'indépendance des États-Unis et l'envoya à tous les utilisateurs du réseau informatique de l'université (ancêtre de l'internet moderne). Selon lui, la mise à disposition de ce document pour les utilisateurs présents et futurs des ordinateurs remboursait sa dette morale. Ce document fut le premier document électronique du projet Gutenberg.

Ensuite, le projet se concentra sur des ouvrages en langue anglaise, en particulier des ouvrages de référence. Le projet s'est ensuite diversifié. Diverses langues sont maintenant représentées, et tous les genres sont couverts, du traité scientifique à la littérature de divertissement. Des périodiques sont également mis en ligne.

Un des atouts du projet Gutenberg, qui explique son exceptionnelle longévité, est l'utilisation de textes ASCII, et plus particulièrement de l'ASCII 7 bits. Bien que moins agréables à utiliser, les ouvrages ainsi codés restent lisibles très longtemps et sur toutes les machines. Le projet Gutenberg est ainsi à l'abri de la disparition d'un format, car il est peu probable que l'ASCII disparaisse ou soit radicalement modifié, la base de textes restera donc visible très longtemps. Mais une diversification était indispensable : l'ASCII à 7 bits, en particulier, ne permet pas de noter les caractères accentués, indispensables pour les textes en français, par exemple. On obtient de plus une bien meilleure mise en forme avec un fichier au format HTML. Le projet Gutenberg s'est adapté, et on peut aujourd'hui télécharger la plupart des livres en choisissant son format : ASCII 7 bits, Latin-1. Mais aussi être présenté sous forme HTML (contenant d'éventuelles illustrations), LaTeX pour les ouvrages scientifiques, etc.

Depuis plusieurs années, on discute sur l'utilisation d'un format XML, mais les progrès sur ce point sont lents. Les formats qui ne sont pas facilement éditables, tels que PDF, sont généralement jugés comme ne correspondant pas aux buts du Projet Gutenberg ; certains cependant ont été utilisés par la collection.

Le projet a été hébergé par plusieurs universités, jusqu'en 2000, où le projet Gutenberg a été officiellement organisé sous la forme d'une entité juridique sans but lucratif (non-profit organization en droit américain), dont le statut correspond à peu près à celui des associations loi de 1901 de droit français. En particulier, les dons fait par les citoyens américains à cette organisation sont déductibles des impôts.

Distributed Proofreaders[modifier | modifier le code]

Au début, une personne seule soumettait son texte au site ce qui demandait un important travail, mais un système plus perfectionné a été mis en place. Fondé en 2000, Distributed Proofreaders est maintenant la source principale de livres du projet Gutenberg. Certaines personnes s'occupent de scanner les pages et de faire tourner un logiciel de reconnaissance optique de caractères. Puis les textes obtenus sont mis à disposition des autres volontaires qui relisent page par page afin de corriger les différentes erreurs laissées par le logiciel de reconnaissance optique. Chaque page est relue au moins deux fois. Enfin, quelqu'un s'occupe de la mise en page en fichier texte, et de l'éventuelle production d'un fichier HTML.

Notes et références[modifier | modifier le code]

  1. A la date du 6 septembre 2009, la liste des ouvrages contenait non seulement 25101 références en anglais, mais aussi 1469 références en français, 601 en allemand, 444 en néerlandais, 402 en chinois, 348 en portugais, 259 en espagnol et 210 en italien.
  2. a et b Le site Distributed Proofreaders est en cours de traduction en français et permettra donc très bientôt à tous les volontaires (même à ceux d'entre eux qui ne maîtriseraient pas bien la lecture des consignes écrites en anglais) de contribuer, en s'inscrivant comme relecteurs, à l'enrichissement de la liste des parutions disponibles en français.
  3. Site Gutenberg (consultation du 7 avril 2008).
Sources

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]