Projet Gutenberg

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Gutenberg.
Logo de la maison d'édition
Repères historiques
Création 1er décembre 1971
Fondée par Michael Hart
Fiche d’identité
Spécialités Littérature en ligne
Site web www.gutenberg.org

Le projet Gutenberg est une bibliothèque de versions électroniques libres (parfois appelés e-texts) de livres physiquement existants. Les textes fournis sont essentiellement du domaine public, soit parce qu'ils n'ont jamais été sujets à des droits d'auteur soit parce que ces derniers sont expirés. Il y a également quelques textes toujours sous droit d'auteur, mais malgré tout rendus disponibles pour le projet avec la permission de l'auteur. Le projet fut lancé par Michael Hart en 1971 et nommé en hommage à l'imprimeur allemand du XVe siècle Johannes Gutenberg[1].

Information générale[modifier | modifier le code]

Principe de base[modifier | modifier le code]

Le slogan du projet, « brisons les barrières de l'ignorance et de l'illettrisme », a été choisi parce que le projet espère continuer l'œuvre de répandre le lettrisme et le goût pour l'héritage littéraire, ce que commença à faire la bibliothèque publique au début du XXe siècle. L'objectif principal du Projet Gutenberg est de permettre l'accès pour tous à la littérature, et d'élargir son public cible habituel (normalement composé principalement d'étudiants et de professeurs)[2].

Tous les textes du projet Gutenberg peuvent être acquis et redistribués par les lecteurs sans aucun frais. Le projet possède la marque déposée de « projet Gutenberg » et l'utilisation commerciale des e-texts sous marque déposée requiert un droit payable au Projet. L'en-tête ôté et la marque non utilisée, le texte peut être utilisé sans restrictions (il y a quelques textes sous droit d'auteur dans le Projet, qui ont d'autres restrictions).

Histoire[modifier | modifier le code]

Le projet a été initié en 1971 par Michael Hart, à l'université de l'Illinois aux États-Unis. Ayant eu à sa disposition, grâce à des amis administrateurs, du temps de calcul sur un ordinateur mainframe estimé à l'époque valoir 100 000 000 de dollars, il chercha un moyen de rendre ce qui lui avait été donné[2]. Il estima alors que la plus grande valeur créée par les ordinateurs n'était pas le calcul, mais le stockage, la mise à disposition et la recherche de ce qui était entreposé dans les bibliothèques. En guise de preuve de concept, il saisit une copie de la déclaration de l'indépendance des États-Unis et l'envoya à tous les utilisateurs du réseau informatique de l'université (ancêtre de l'internet moderne). Selon lui, la mise à disposition de ce document pour les utilisateurs présents et futurs des ordinateurs remboursait sa dette morale. Ce document fut le premier document électronique du projet Gutenberg.

Ensuite, le projet se concentra sur des ouvrages en langue anglaise, en particulier des ouvrages de référence. Son objectif initial était de rendre les 10 000 livres les plus consultés accessible au public, gratuitement ou presque, avant la fin du 20e siècle[3]. Le projet s'est ensuite diversifié. Diverses langues sont maintenant représentées, et tous les genres sont couverts, du traité scientifique à la littérature de divertissement. Des périodiques sont également mis en ligne.

Le projet a été hébergé par plusieurs universités, jusqu'en 2000, où le projet Gutenberg a été officiellement organisé sous la forme d'une entité juridique sans but lucratif (non-profit organization en droit américain), dont le statut correspond à peu près à celui des associations loi de 1901 de droit français. En particulier, les dons fait par les citoyens américains à cette organisation sont déductibles des impôts.

Statistiques et catalogue[modifier | modifier le code]

En février 2017, Projet Gutenberg offrait plus de 53 000 livres numériques[4]. La plupart des œuvres sont en anglais, mais les langues sont de plus en plus diversifiées[5]: la plateforme offre des ouvrages en français[6], allemand, néerlandais, chinois, portugais, espagnol, italien, finnois, et liste plus de 40 autres langages. Projet Gutenberg propose également, en plus de la version anglaise, quatre autres « bibliothèques » principales (allemand, français, italien et portugais)[7].

Mission[modifier | modifier le code]

La principale mission du Projet Gutenberg est la production et la diffusion de livres numériques; dans cet esprit, les propriétaires acceptent 99% des requêtes qui lui sont adressés pour la production de ces ouvrages numériques. Leur projet n'est aucunement influencé par des critères financiers ou politiques, ce qui en garantit la pleine liberté et une universalité optimale; cela implique également que la majorité du travail est effectué uniquement par des bénévoles[8]. Ils encouragent tous et chacun à participer au projet, leur offrant énormément de liberté pour créer des livres numériques comme bon leur semble; l'important, pour eux, est réellement d'offrir le plus de livres possibles, dans le plus de langues possibles de façon à ce que le monde entier puisse avoir accès à la littérature[8].

Fonctionnement[modifier | modifier le code]

Les livres sont produits presque entièrement par des volontaires, et demeure en activité. La liste des livres électroniques disponibles s'enrichit peu à peu chaque jour par la contribution de correcteurs, chacun a vocation à devenir correcteur bénévole[6] en s'inscrivant sur l'un ou l'autre des sites de « distributed proofreaders », et en se portant ainsi volontaire pour la correction "page par page". Le projet offre également le plus possible de liberté à ses volontaires, leur offrant un vaste choix concernant le choix des livres et leur format[8].

Un des atouts du projet Gutenberg, qui explique son exceptionnelle longévité, est l'utilisation de l'ASCII 7 bits. Bien que moins agréables à utiliser, les ouvrages ainsi codés restent lisibles très longtemps et sur toutes les machines. Le projet Gutenberg est ainsi à l'abri de la disparition d'un format, car il est peu probable que l'ASCII disparaisse ou soit radicalement modifié; la base de textes restera donc visible très longtemps. Le principe est simple; plutôt que d'utiliser des italiques, caractères gras ou autre formatage spécial souvent utilisés dans les livres, l'ASCII convertit ce type de texte en lettres majuscules, ce qui permet une universalité du texte plus accessible à tous les types de logiciels. Mais une diversification était indispensable : l'ASCII à 7 bits, en particulier, ne permet pas de noter les caractères accentués, indispensables pour les textes en français, par exemple. On obtient de plus une bien meilleure mise en forme avec un fichier au format HTML. Le projet Gutenberg s'est adapté, et on peut aujourd'hui télécharger la plupart des livres en choisissant son format : ASCII 7 bits, Latin-1, HTML (contenant d'éventuelles illustrations), LaTeX pour les ouvrages scientifiques, etc. Également, les ouvrages en ASCII offrent l'opportunité d'être téléchargés tels quels, puis convertis en un autre format, mieux adapté selon les pays, ou les individus, aux besoins spécifiques de tous et chacun[2]. Certains organismes tels Blackmast Online, Manybooks.net ou encore Bookshare.com vont également se charger de convertir à plus grande échelle les formats en ASCII pour leur clientèle[2].

Depuis plusieurs années, on discute sur l'utilisation d'un format XML, mais les progrès sur ce point sont lents. Les formats qui ne sont pas facilement éditables, tels que PDF, sont généralement jugés comme ne correspondant pas aux buts du Projet Gutenberg ; certains cependant ont été utilisés par la collection.

Distributed Proofreaders

Au début, une personne seule soumettait son texte au site ce qui demandait un important travail, mais un système plus perfectionné a été mis en place. Fondé en 2000, Distributed Proofreaders est maintenant la source principale de livres du projet Gutenberg. Certaines personnes s'occupent de scanner les pages et de faire tourner un logiciel de reconnaissance optique de caractères. Puis les textes obtenus sont mis à disposition des autres volontaires qui relisent page par page afin de corriger les différentes erreurs laissées par le logiciel de reconnaissance optique. Chaque page est relue au moins deux fois. Enfin, quelqu'un s'occupe de la mise en page en fichier texte, et de l'éventuelle production d'un fichier HTML.

Critiques[modifier | modifier le code]

Des critiques ont été adressées envers quelques e-texts du Projet Gutenberg concernant leur manque d'érudition. Par exemple, le détail insuffisant des éditions utilisées et l'omission des préfaces originelles publiées, ainsi que de l'appareil critique. À cause de ces défauts, l'édition électronique ne serait pas une copie fidèle à l'édition papier, et serait inutilisable dans le cadre d'un travail universitaire. La confrontation des premiers e-texts aux nouveaux permet de constater une tendance à la meilleure préservation de tels textes ; la plupart des nouveaux textes conservent l'information et les préfaces de l'édition originale.

À l'époque, la majeure critique concernait principalement l'utilisation de l'ASCII : la présentation serait peu attrayante et difficile à lire sur un écran, offrirait un contenu d'apparence déstructurée, en plus de ne contenir que peu ou pas d'indications de contenu, format, style, etc[9]. Bien qu'avec le temps plusieurs améliorations aient été apportées, ce format privilégié par le Projet Gutenberg n'est toujours pas le plus agréable à lire, et déplaît à plus d'un.

En décembre 1994, la Text Encoding Initiative reprochait au projet de ne pas inclure les décisions inévitables lors de la préparation d'un texte, soit, dans plusieurs cas, le choix d'une version spécifique lorsqu'il en existe plusieurs ou que ces dernières sont contradictoires[10].

Également, la sélection des ouvrages et de leurs éditions, puisqu'elle est régie par des bénévoles, est donc déterminée par la popularité, la facilité de conversion au format numérique, leur absence de droits d'auteurs et autres facteurs du genre, ce qui affecte l'impartialité du catalogue offert[11].

En mars 2004, une nouvelle initiative (Projet Gutenberg 2) a été lancée par Michael Hart et John S. Guagliardo (directeur exécutif de la World E-Book Library), ayant pour but d'offrir des droits de propriété intellectuelle à faible coût. Néanmoins, cela a suscité une certaine polémique chez les bénévoles du Projet Gutenberg 1, parce que cela impliquait la réutilisation du nom de commerce du projet à des fins économiques et commerciales[12].

Projets affiliés[modifier | modifier le code]

  • Project Gutenberg Australia héberge plusieurs textes d'auteurs australiens ou ayant pour sujet l'Australie. Ces textes sont du domaine public selon les législations australiennes, mais il y en a plusieurs qui sont toujours sous droit d'auteur (ou sous statut incertain) selon les lois des États-Unis[13].
  • Project Gutenberg Canada
  • Project Gutenberg Consortia Center (aussi connu sous le nom de Project Gutenberg Self-Publishing Press) se spécialise dans la collection de collections (le site offre des collections thématiques, ainsi qu'une vaste sélections de langue). Ces collections ne font toutefois pas objet de révision linguistique, et n'offrent pas non plus le formatage du principal Projet Gutenberg[14].
  • Projekt Gutenberg-DE revendique, pour sa part, les droits d'auteurs de ses ouvrages numériques et en limite l'accès aux version en ligne seulement[15].
  • Project Gutenberg Europe est un projet de Project Rastko en Servie. Son objectif est d'établir un « Projet Gutenberg » pour toute l'Europe; il a commencé à publier ses premiers textes en 2005, et utilise également Distributed Proofreaders[16].
  • Project Gutenberg Luxembourg publie principalement (mais pas uniquement) des livres rédigés en luxembourgeois[17].
  • Projekti Lönnrot est un projet démarré par des bénévoles du Finnish Project Gutenberg (Projet Gutenberg version finlandaise), dont le nom est un dérivé du philologue finlandais Elias Lönnrot (1802–1884)[18].
  • Projet Gutenberg des Philippines vise à produire le plus de livres possibles, pour le plus de gens possibles, en mettant l'accent sur la littérature des Philippines ou dans un langage des Philippines[19].
  • Project Gutenberg Russia est un projet qui a pour but de récupérer du domaine public les livres publiés en langues slave (particulièrement ceux en russe). Une discussion concernant la légalité de ce projet a commencée en avril 2012; le mot « Rutenberg » serait une combinaison des mots « Russie » et « Gutenberg »[20].
  • Project Gutenberg of Taiwan cherche à archiver tous les livres libres de droit d'auteur qui ont pour sujet le Taïwan, que ce soit en anglais, en mandarin ou en langue taïwanaise. Il s'agit d'un projet spécial de Furomosa.com[21].

Notes et références[modifier | modifier le code]

  1. (en) « The History and Philosophy of Project Gutenberg by Michael Hart », sur gutenberg.org,‎ (consulté le 2 avril 2017)
  2. a, b, c et d « Dossiers du NEF - Le Projet Gutenberg, de 1971 à 2005 », sur www.etudes-francaises.net (consulté le 31 janvier 2017)
  3. (en) Day, B. H.; Wortman, W. A., Literature in English: A Guide for Librarians in the Digital Age, Chicago, Association of College and Research Libraries, (ISBN 0-8389-8081-3), p.170
  4. (en) « Accueil », sur gutenberg.org,‎ (consulté le 10 février 2017)
  5. À la date du 6 septembre 2009, la liste des ouvrages contenait non seulement 25101 références en anglais, mais aussi 1469 références en français, 601 en allemand, 444 en néerlandais, 402 en chinois, 348 en portugais, 259 en espagnol et 210 en italien.
  6. a et b Le site Distributed Proofreaders est en cours de traduction en français et permettra donc très bientôt à tous les volontaires (même à ceux d'entre eux qui ne maîtriseraient pas bien la lecture des consignes écrites en anglais) de contribuer, en s'inscrivant comme relecteurs, à l'enrichissement de la liste des parutions disponibles en français.
  7. (en) « Bookshelf », sur gutenberg.org,‎ (consulté le 10 février 2017)
  8. a, b et c (en) « Project Gutenberg Mission »,‎ (consulté le 10 février 2007)
  9. (en) Frank Boumphrey, « European Literature and Project Gutenberg »,‎ (consulté en février 2017)
  10. (en) Michael Sperberg-McQueen, « Textual criticism and the Text Encoding Initiative »,‎ (consulté le 25 juillet 2015)
  11. (en) Hoffmann, Sebastian, Grammaticalization And English Complex Prepositions: A Corpus-based Study, Routledge, (ISBN 0-415-36049-8)
  12. (en) Paula Hane, « Project Gutenberg Progresses »,‎ (consulté le 20 août 2007)
  13. (en) « Project Gutenberg Australia »,‎ (consulté le 10 février 2017)
  14. (en) « Project Gutenberg Consortia Center »,‎ (consulté le 10 février 2017)
  15. (de) « Projekt Gutenberg »,‎ (consulté en août 2007)
  16. (en) « Project Gutenberg Europe »,‎ (consulté en août 2017)
  17. (lb) « Project Gutenberg Luxembourg »,‎ (consulté en août 2007)
  18. (fi) « Projekti Lönrot »,‎ (consulté en août 2007)
  19. (en) « Project Gutenberg of the Philippines » (consulté en août 2007)
  20. (en) « Project Gutenberg Russia » (consulté en août 2007)
  21. (en) « Project Gutenberg of Taiwan » (consulté en avril 2009)
Sources

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]