Édition électronique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'édition électronique est une forme d'édition dans laquelle le numérique joue un rôle plus ou moins important, allant de la simple mise en page d'un livre en utilisant un logiciel de PAO (Publication assistée par ordinateur) en vue de l'impression papier d'un livre jusqu'à la création et la diffusion en ligne d'œuvres. L'édition électronique, qui tend à se développer depuis plusieurs années, coexiste donc avec l'édition papier sans vouloir la remplacer.

L'histoire de l'édition électronique se divise en trois temps : le temps de la numérisation, le temps de l'édition numérique et le temps de l'édition en réseau. C'est l'ensemble de ces trois temps qui compose l'édition électronique, les modèles ne se remplacent pas l'un l'autre.

La numérisation[modifier | modifier le code]

Naissance de l'informatisation des textes imprimés et manuscrits : le projet Gutenberg[modifier | modifier le code]

L'informatisation au format "texte" est née aux États-Unis en 1971 à l’initiative de Michael Hart, alors étudiant à l’université de l’Illinois[1]. Le 4 juillet 1971, jour de la fête nationale, il saisit la Déclaration de l’indépendance des E.-U. (signée le 4 juillet 1776) sur le clavier de son ordinateur. Cette saisie est faite en caractères majuscules, les seuls couramment disponibles alors dans les systèmes informatiques.

En 1989, il lance le Projet Gutenberg avec l'ambition de numériser le patrimoine de l'humanité. Ce projet, qui ne compte pas plus de dix textes à ses débuts, atteint en 2008 le nombre plus important de 25 000 titres. La numérisation a été faite dans un premier temps par saisie au clavier, puis à l'aide de scanners de documents. Les ouvrages concernés par la numérisation sont des textes appartenant au domaine public, non protégés par le droit d'auteur. En 2010 le projet Gutenberg a permis de reproduire en format texte plus de 37 500 ouvrages[2].

La particularité de cette initiative réside dans l'utilisation de technologies rudimentaires produisant une description simple des données. Cela permet d'éviter d'introduire des risques d'incompatibilité avec les systèmes futurs. Par exemple, le livre Napoléon le petit, numérisé en 2007 par le projet Gutenberg, bénéficie d'un encodage simple avec une structuration de données très rudimentaire.

Sous l'impulsion du projet Gutenberg, des projets similaires ont vu le jour.

L’ABU, la Bibliothèque universelle, qui est un projet du Cnam, en arrêt depuis 2002, a reproduit une centaine de textes toujours disponibles.

Plus ambitieux, le projet initialement baptisé "projet Sourceberg", vise la constitution d'une bibliothèque numérique multilingue. Soutenu par la Wikimedia Foundation, il propose un libre accès à l’information, sans publicité, édifié par des bénévoles qui utilisent la technologie wiki. Le 26 décembre, il change officiellement de nom pour devenir « Wikisource ». Il propose quant à lui 55 715 textes libres de droits.

Des projets comparables s'appuient sur une autre stratégie : l'OCR (Optical Character Recognition, ou ROC : reconnaissance optique de caractères) : à partir d'une reproduction de la page par scanner, sous forme image, le texte est reconstitué. Cette technique, qui permet de passer du mode image au mode texte, a toutefois l’inconvénient de laisser beaucoup de coquilles.

La pérennité : un enjeu essentiel de la numérisation[modifier | modifier le code]

Cet enjeu soulève de nombreuses inquiétudes concernant la démagnétisation des supports. La mauvaise fiabilité des stockages et l’évolution rapide des formats (apparition des formats propriétaires) posent de réels problèmes de conservation physique des fichiers. Cette dernière comprend deux logiques : le back-up et l’archivage.

  • Le back-up correspond à la duplication des données.
  • L’archivage fait référence à la conservation et la duplication sur le long terme.

Quelques exemples:

OAIS : (Open Archival Information system) il s’agit d’un système de gestion de documents numériques utilisé uniquement par les professionnels.

LOCKSS : utilisé pour les structures plus petites comme les bibliothèques. Celles-ci peuvent mettre leurs données au sein d’un réseau et copier le fichier autant de fois qu’il y a d’utilisateurs.

CLOCKSS : ressemble à LOCKSS mais permet un contrôle plus grand sur le réseau des acteurs.

Les premières bibliothèques numériques[modifier | modifier le code]

Après le développement du projet Gutenberg, et bientôt suivi d'autres projets du même type consistant à copier les textes à la main, des projets plus ambitieux, dans lesquels sont mis à disposition sur intranet ou Internet des œuvres reproduites par scanner sous forme image, ont vu le jour.

La société Leaders, en Belgique, en 1989 (après 4 ans de préparation), sous l'impulsion de son fondateur René Janray, a élaboré et commercialisé une banque de données juridiques homonyme (LEADERS) dont les particularités consistaient entre autres à l'utilisation d'un logiciel tel qu'utilisé ultérieurement sur internet et à des mises à jour périodiques (généralement mensuelles) par disquettes dans un premier temps et par CD-ROM dans un second temps. Ce système préfigurait l'utilisation d'internet. Ce système innovant et probablement unique, a fait l'objet d'une thèse universitaire (ISAT) en 1995(Karine Emonds) et d'un ouvrage dans la collection Marabout consacrée aux éditions électroniques, en 1999, sous la signature de Stéphane Mercier. On peut donc considérer ce système comme le plus élaboré qui ait existé avant l'utilisation d'internet.

Gallica a été lancé en 1998 par la Bibliothèque nationale de France. Elle reproduit dans un premier temps des ouvrages anciens imprimés, mais aussi des livres récents sous droits de la BNF et d'autres établissements, comme la bibliothèque municipale de Lyon. Les estampes et collections inconographiques de même que les manuscrits ont été ajoutés depuis.

Le risque d'un monopole de la numérisation par Google livres[modifier | modifier le code]

Google livres

Les différents projets de reproduction des livres menés jusque-là ont été bouleversés par Google livres, entreprise de numérisation en mode image et OCR du patrimoine de l'humanité. Sept millions d'ouvrages ont aujourd’hui été numérisés dans différentes bibliothèques.

Pour comprendre la stratégie de Google, il est utile de distinguer les trois temps juridiques d’un livre : le temps pendant lequel il n'y a plus de droits d’auteurs ; une période sous droit (auteur ou ayant droit) ; et entre les deux une zone grise, période couverte par le droit d’auteur, mais pendant laquelle persiste un flou sur la capacité de l'ayant droit à faire valoir son droit. Beaucoup d'œuvres restent en effet orphelines, et cette zone grise suscite beaucoup d'intérêt. Google a donc décidé de redonner vie à ces œuvres inexploitées.

Des éditeurs se sont ainsi attaqués à Google : aux États-Unis, un accord a été trouvé dans la tenue d'un registre de gestion des droits des œuvres orphelines, géré et financé par Google (qui a dédommagé des nombreux éditeurs). Cet accord n'est toujours pas opérationnel. Sur le même type de conflit, La Martinière a, lui, obtenu gain de cause en France. Un autre reproche souvent fait à Google réside dans le fait que ce dernier procède par ailleurs à l'indexation et la numérisation automatique des œuvres de Google livres[3].

Les tentatives de GBS pour prendre le monopole de la numérisation met en lumière le problème de la propriété intellectuelle sur le web et du droit d'auteur. Quand un contrat est formé entre un auteur et un éditeur, il n'est pas possible de mentionner « tous supports » : chacun des supports doit être mentionné (papier, CD-Rom, Internet, etc.). Les supports non mentionnés sont exclus du contrat. Il y a un processus de mise à jour des contrats pour avoir les droits Internet sur les ouvrages édités. Les auteurs n'adoptent pas de position claire, c'est donc l'occasion de négocier les contrats, notamment en ce qui concerne la durée. Régime de la licence est apparu avec Internet à cause de la révolution de l'accès provoquée par le réseau. Bien qu'il existe des exceptions du Droit d'auteur pour les handicapés, et à des fins d’enseignement et de recherche, sans les licences, les échanges entre auteurs et personnes souhaitant utiliser leurs œuvres exploseraient puisqu'utiliser une œuvre sans autorisation de son auteur est interdit par la Loi.

Dans Google livres, il y a différentes fonctionnalités sociales permettant d'interagir avec les autres internautes ou bien avec les créateurs du site :

  • Il est possible de signaler les anomalies, ce qui permet à Google d'améliorer la qualité de ses données (initialement fortement perfectibles).
  • Il est possible de laisser son avis à destination du lectorat.
  • Il est possible de partager le lien du document sur sa messagerie ou sur son site web (génération de code)
  • Il est possible de sélectionner seulement une partie du texte et de le partager de la même façon.

Quelques exemples de contre-offensive à la prise de monopole par Google livres :

L'Open Content Alliance

Ce projet non commercial[4] aurait numérisé un million d'ouvrages avec autorisation des ayants droit.

Pour l’heure, Google a gagné la bataille de la vitesse et du nombre d'ouvrages en ligne, notamment en exploitant la capacité de calcul de centres de données (data-center[5]), fermes de données de serveurs par milliers, répartis partout dans le monde, permettant entre autres des opérations de traduction, de data-mining, etc.

Gallica

Gallica semble réfléchir à un partenariat avec Google.

Europeana

Europeana : bibliothèque virtuelle européenne, est en cours de construction, et annonce la numérisation de trois millions d'ouvrages.

ABU

Bibliothèque universelle : à l'arrêt depuis 2002, quelques centaines de livres disponibles.

Wikisource

Wikisource : 55 715 textes libres de droit.

L'édition numérique[modifier | modifier le code]

Cette section ne cite pas suffisamment ses sources. Pour l'améliorer, ajouter en note des références vérifiables ou les modèles {{Référence nécessaire}} ou {{Référence souhaitée}} sur les passages nécessitant une source.

Deuxième âge de l'édition électronique, celui où l'édition de texte est nativement numérique mais n'est pas encore pensée spécifiquement pour les usages en réseau. L'édition numérique illustre bien l'un des enjeux essentiel de l'édition électronique, à savoir l'accessibilité d'un texte. C'est en effet le plus révolutionnaire des enjeux de l'édition électronique. On bascule d'un univers analogique à un univers numérique où la circulation et l'accessibilité sont facilitées, ce qui entraîne une explosion de l'accès. Par exemple, les revues scientifiques comptent beaucoup plus de lecteurs dans leur version numérique que dans leur version papier. C'est donc une véritable révolution de la consultation grâce à l'accessibilité du web.

Avec l’arrivée du numérique, on a beaucoup dématérialisé les œuvres. Cette dématérialisation massive a poussé à mettre en place une logique de rematérialisation. Le numérique a de nombreux avantages, il permet :

  • Une impression de livres à la demande (print on demand)

Ce système commence à être utilisé dans les bibliothèques. Cette logique est également développée par Wikipédia.

  • Un débouché commercial pour les œuvres en libre accès.
  • Un aspect pratique pour la lecture, la conservation et l'annotation.

On a souvent tendance à associer l’impression à la demande à l’autoédition (cf. Lulu.com). En fait, l'impression à la demande correspond aussi à des démarches d'édition très professionnelle, qui couvrent des marchés de niches, ou qui concernent des épuisés. Cela permet de s'émanciper des questions d'investissement pour le tirage initial, ainsi que des problèmes de stockage.

Le travail d'un éditeur électronique reste comparable à celui d'un éditeur traditionnel. Il reçoit des manuscrits. Il les sélectionne, il les retravaille avec les auteurs pour les corrections éventuelles, mais plus souvent en ligne. Il effectue ensuite les opérations classiques de mise en page, illustration, mais l'impression papier est remplacée par la production de fichiers en différents formats de livre numérique. Après publication, il devra faire connaître l'œuvre, gérer les ventes, reverser la rémunération à l'auteur…

Économiquement parlant, en France, une autre différence notable réside dans leur différence de traitement par l'administration fiscale : l'édition traditionnelle bénéficie d'un taux de TVA réduit, tandis que l'édition électronique supporte le taux de TVA standard, au même titre que l'informatique, dont elle est issue. Malgré la naissance de certaines polémiques cette norme semble perdurer. En effet, le 28 octobre 2010, la proposition de loi déposée par le député de Savoie (UMP) Hervé Gaymard et défendue par le Syndicat national de l'édition qui souhaitait que les fichiers numériques soient taxés au même niveau que le livre papier, fut rejetée par le Sénat. Celui-ci refuse l'abaissement de la TVA sur le livre numérique à 5,5 % au lieu de 19,6 %. Les sénateurs ont cependant accepté à l'unanimité la proposition de loi présentée par l'UMP sur le prix du livre numérique qui permet à l'éditeur de fixer le prix de vente au public comme il le fait pour le livre papier. Pour l'instant cette loi est réservée aux éditeurs français mais un amendement visant à l'étendre aux éditeurs établis à l'étranger publiant leurs livres en France a été réclamé.

Comme dans l'édition traditionnelle, la relation entre l'auteur et l'éditeur électronique est régie par un contrat signé par les deux parties, définissant les droits et les obligations de chacun, leur rémunération, et l'engagement de l'éditeur à diffuser l'œuvre. Une différence cependant : contrairement à un livre imprimé, l'œuvre numérique n'est jamais « épuisée », alors qu'en édition traditionnelle l'épuisement du stock pouvait conduire à l'extinction du contrat, si l'éditeur n'entreprenait pas une réimpression dans un délai fixé. La durée du contrat (obligatoirement limitée, pour respecter la loi sur le droit d'auteur) doit donc être définie par d'autres critères.

Les modèles économiques de l'édition électronique restent largement à inventer. On distingue la vente à l'unité (Amazon) et l'abonnement à des bouquets (Safari d'O'Reilly).

Dans ce domaine se pose la question du prix du livre numérique qui peut provoquer une décote par rapport à l'édition papier. Mise en place d'offres plus attrayantes.(vente avec une garantie) Quelques exemples de modèles économiques:

  • Modèle freemium : associe une offre gratuite, en libre accès, et une offre « Premium », haut de gamme, en accès payant.

Exemple : Flickr. On peut y déposer gratuitement nos images, gratuit jusqu’à 200 images, au-delà il faudra payer ou accepter de perdre les plus anciennes photos. Pour avoir accès à l’offre prémium: 2 dollars/mois

  • Modèle de longue traîne : Dans le monde réel, ces contraintes-là sont très importantes.

Par exemple : la Fnac : dans le modèle de longue traîne, il y aura une explosion du pourcentage de livre (CA de la librairie en ligne), ça peut être des hits qui ont eu beaucoup de résultat au début. Ce sont des livres qui se vendent régulièrement. Les différentes offres économiques :

  • Safari : offre de bouquet de l'éditeur O'Reilly Media, on crée un modèle de bouquet de livre sur les technologies, qui rapporte de l’argent à l’éditeur, et qui donne au lecteur un accès à un catalogue assez conséquent, mais assez limité.
  • Wikipédia : qui s’appuie sur des dons en infrastructure (par exemple google et particuliers). C'est un financement populaire. Chaque année, ils font des appels de dons, qui leur rapportent environ 8 millions de dollars par an. C’est un modèle qui existait déjà, qui est un modèle de souscription.

L'édition en réseau[modifier | modifier le code]

C'est l'édition nativement en ligne, dans laquelle on rédige les textes sur le réseau lui-même. L'archétype de l'édition en réseau est Wikipédia. Les blogs et les Wikis font partie de l'édition en réseau. Alors que les blogs sont des contenus publiés directement par l'auteur, sans intermédiaire (désintermédiation), les encyclopédies collaboratives, comme Wikipédia, sont de plus en plus régulées, ainsi que le montrent le nombre et la complexité des rôles différents de l'encyclopédie, l'évocation des guerres d'édition et d'une stratégie de labellisation des notices les plus complètes, ainsi que d'une politique d'avertissements clairs concernant les notices qui sont incomplètes ou l'objet de fortes controverses.

Licence libre contre licence propriétaire[modifier | modifier le code]

Le régime de la licence permet à l’ayant droit de décider de donner à son œuvre une licence d’utilisation bordée par des conditions. La première licence est la GNU, à l’initiative de Richard Stallman, et la seconde la GPL (qui s’applique essentiellement aux logiciels, et se base sur un système de Copyleft - voir Licence publique générale GNU). Différentes licences peuvent s’appliquer aux œuvres textuelles, telle que la licence Creative Commons, adoptée par Wikipédia depuis 2009. Cette licence « à la carte » permet de définir des contraintes sur la paternité de l’œuvre, ses modifications, son utilisation commerciale, etc. La formule la plus ouverte est la CC-by, et la plus fermée la CC-by-nc-md. Si quelqu’un souhaite outrepasser une licence Creative Commons, il lui faut établir un contrat avec l’ayant droit. Ce régime ne s’oppose donc pas à celui du contrat et d’une exploitation commerciale, et lui est au contraire complémentaire.

Technologies[modifier | modifier le code]

Au sein de l’édition numérique on peut distinguer trois catégories de supports électroniques :

Le web[modifier | modifier le code]

Le web est un système hypertexte (soit il contient des hyperliens et des informations)public fonctionnant sur Internet. Il permet de consulter, à l’aide d’un navigateur, des pages accessibles sur divers sites. Les livres consultables sur le web sont sous différents formats, dont l’EPUB (qui clone le format papier). Ces livres « web » sont en réalité des fichiers dynamiques. Il s’agit de documents web générés en temps réel, soit au moment où ils sont consultés. Grâce à des flux RSS continus, la page présente de nouvelles informations lors de chaque consultation du lecteur.

La technologie utilisant le papier électronique : les liseuses[modifier | modifier le code]

Articles détaillés : Papier électronique et Liseuse.

La « liseuse » (« bouquineur » ou « reader ») est un tablette électronique qui permet de restituer un texte sous format numérique. Il y a peu, les fabricants proposaient des machines dites « à afficher ». Celles-ci étaient peu autonomes, lourdes, rétro-éclairées et se rapprochaient sensiblement des Tablet PC. Aujourd’hui, les fabricants adoptent une vision différente en utilisant des dispositifs de lecture e-paper. Il s’agit d’une technique d’affichage qui imite l’apparence d’une feuille imprimée et qui ne nécessite pas de rétro-éclairage. Le papier électronique est aussi appelé e-paper.

Quelques exemples :

Electronic paper (Side view of Electrophoretic display).PNG

Avec sa Kindle DX, Amazon propose une technologie sans scintillement, qui ne nécessite pas de rétro-éclairage. Seul le changement de statut à l’écran requiert de l'énergie. Produisant peu de lumière, la Kindle Dx est ainsi moins fatigante pour les yeux. Mais, malgré ces nombreux avantages, cette liseuse présente certains aspects décevants. La Kindle Dx (comme beaucoup de ses concurrents) ne possède pas d'écran couleur. Ce dernier se compose uniquement de plusieurs niveaux gris. La liseuse ne possède pas d’écran tactile ni de connexion Internet. Le changement d’une page à l’autre demeure relativement lent. Peu interactive, elle présente un menu extrêmement simple. Les copier-coller, les annotations, les signets et les soulignements ne sont pas envisageables (ou sont de très mauvaise qualité) sur ce modèle.

Amazon Kindle 4

La Cybook Opus se décline en une dizaine de couleurs. De forme arrondie, la liseuse française possède dès son achat une bibliothèque de soixante-quatre ouvrages. Malgré de nombreux avantages, Cybook Opus présente de nombreux aspects décevants. La liseuse ne possède pas d’écran tactile ni de connexion internet. Peu interactive, elle présente un menu extrêmement simple. Les copier-coller, les annotations et les soulignements ne sont pas envisageables sur ce modèle.

Les smartphones et tablettes[modifier | modifier le code]

Un smartphone est un téléphone « intelligent » mobile disposant des fonctions d’un assistant électronique : agenda, navigation web, messagerie et depuis peu lecteur d’e-books. Ces applications diverses sont développées par le fabricant, l’opérateur ou l’éditeur de logiciel. Certains de ces logiciels ou applications, tel Stanza, Androïd, Aldiko, permettent de rapatrier des titres sur son IPhone (ou IPod-Touch) et de constituer sa propre bibliothèque. Ces derniers, gratuits, sont des concurrents directs des liseuses.

En Afrique subsaharienne et dans le monde arabe, le taux de pénétration de la téléphonie mobile est nettement supérieur à celui d'Internet: respectivement 41 % contre 9,6 % dans le sud de l'Afrique, et 79,6 % contre 24,9 % au Maghreb et au Moyen-Orient[6], ce qui rend le support nettement plus intéressant à exploiter qu'un ordinateur. Le service AirPac, lancé par l'université d'Afrique du Sud en 2009, propose à tous les utilisateurs de sa bibliothèque un accès à tout le catalogue ainsi que la possibilité de réserver les ouvrages par le biais de leur téléphone portable. Depuis 2007, plus de 100 000[7] livres électroniques ont été distribués rien qu'en Afrique du Sud. L'utilisation des téléphones portables permet, dans des pays où l'édition et la distribution de livres ne sont pas aussi développées qu'en Occident, de proposer aux utilisateurs des livres qu'ils ne pourraient pas se procurer en librairies.

Quelques exemples :

Nintendo, a sorti courant 2010 sa toute dernière Nintendo DSi Xl accompagnée d’un « jeu » éducatif intitulé 100 livres classiques. Le marché du livre numérique est en plein essor et en réunissant ainsi une centaine d’œuvres classiques sur une simple cartouche DS, le constructeur Nintendo a montré que lui aussi comptait y prendre part. Dès les premières prises en mains, les utilisateurs découvrent un défaut principal : le format d’écriture. Même au plus faible niveau de zoom, la Nintendo ne peut afficher que quatre à cinq mots par ligne. Il est donc évident que les longues phrases ne peuvent tenir sur une même page. Ce format d’écriture pose de réels problèmes de lecture. Le texte est déstructuré, ce qui pour un ouvrage classique (tel l’Iliade d’Homère) le rend encore plus difficile à déchiffrer.

Présenté récemment aux États-Unis, l'iPad serait selon ses constructeurs la grande révolution de cette année 2010. Malgré des innovations constantes, la liseuse est un dispositif aux ressources limitées. Elle n’a qu’une seule utilité : lire des livres numériques. L’i-Pad apparaît alors comme une véritable nouveauté. Il s’agit d’une tablette, (aux dimensions imposantes) à écran tactile, possédant presque toutes les applications d’un iPhone. Parmi ses nombreux logiciels installés figurent Safari, Mail, Photos, Vidéo, iPod, iTunes, Notes et iBooks. Ce dernier est une application permettant l’achat et la lecture de livres numériques.

Impression à la demande[modifier | modifier le code]

Article détaillé : Impression à la demande.

L'expansion de l'impression à la demande est une révolution dans le monde de l'édition. On le voit notamment avec le cas de l'Amérique du Sud. Aujourd'hui la plupart des capitales disposent de points d'impression POD. Nous pouvons citer par exemple Bandeirantes et Singular au Brésil, Bibliografika, Docuprint et Dorrego en Argentine ou encore Publidisa au Mexique. En 2010, l'utilisation de la POD par les éditeurs a augmenté de 12 %, passant de 20 à 32 %[8].

Qualités du texte électronique « idéal »[modifier | modifier le code]

Trois qualités ont été identifiées par Marin Dacos et Pierre Mounier - la lisibilité, la maniabilité et la citabilité[9], auxquelles on peut ajouter la localisation.

Lisibilité

Le livre numérique ainsi diffusé devra être lisible. Cela suppose :

– qu’il soit décrit par un format ouvert, par opposition au format propriétaire (ou formats fermés) ;

Par exemple : l’application livre des sociétés américaines n’est pas du tout décrit grâce à un format ouvert, il s’agit d’un logiciel propriétaire avec des standards qui ne sont pas interopérables entre les liseuses. Il faudra que des consortiums puissent se constituer autour de format ouvert pour espérer avoir une inscription dans la durée des travaux de l’encodage des fichiers destinés à l’édition électronique.

– qu’il soit recomposable (reflowable), c’est une qualité que n’a pas le « PDF », par exemple ce dernier ne permet pas au fichier de s’adapter à la taille de l’écran, alors que le format Epub le permet ;
– qu’il soit conservable, les formats évoluent rapidement et il n’est pas certain que l’on puisse conserver nos fichiers très longtemps car les formats se périment, ou parce qu’une DRM peut être appliquée au fichier. Les mesures techniques de protection mises en place dans le cadre des systèmes de gestion des droits d'auteurs (DRM) repose sur un cryptage du document rendant obligatoire l'utilisation d'un logiciel et d'un système particulier contrôlant les droits du lecteur. Ceci met donc en danger la conservation et la lisibilité du texte.

Maniabilité

Le livre numérique doit être manipulable, pour cela il faut qu’il soit d’abord indexable et cherchable. Plus on créera de livres applications, plus il sera difficile de les indexer et de créer des outils d’indexation. Donc, on aura de plus en plus besoin d’outils pour se faire une cartographie de notre bibliothèque virtuelle. De même, le texte devra être copiable et collable, afin d’être rapidement inséré dans un autre contexte (procédure du copier-coller). Enfin, le texte devra aussi être annotable et inscriptible (annotations, remarques, jalons, etc.) dans des dispositifs ouverts.Par exemple avec le Kindle, on dépend de l’outil d’annotation propre au Kindle, ce qui engendre une dépendance à une société privée.

Citabilité

Le livre doit être citable et ce de façon simple. Le numérique conduit vers des solutions reposant sur la logique d'un identifiant unique (ID). Plusieurs dispositifs mis en place dans différents environnements et reposant sur des logiques différentes, se sont développés. Dans le monde de l'édition du livre, sont utilisés depuis de nombreuses années, l’ISBN pour les livres et l’ISSN pour les périodiques. Ces identifiants uniques décrivent des objets éditoriaux, c'est-à-dire un titre d'ouvrage ou un titre de périodique. La problématique posée aujourd'hui porte sur la granularité (de l’information) et sur le niveau d'identification la plus pertinente : un livre, un chapitre, un article pour des textes juridiques ? Ainsi l’ISBN correspond à un niveau important de granularité puisque c’est le livre en entier qui est identifié, ne permettant pas la citation d'un passage particulier par ce type de mécanisme.

Localisation
Il ne suffit pas de recueillir la citation d'un ouvrage : localiser l'ouvrage reste une étape décisive. Le numérique permet d'articuler citation et localisation et bien souvent les deux sont confondus. Il semble pourtant indispensable de distinguer ces deux fonctions. Citons deux systèmes utilisés : les URL, système ouvert proposé dans le cadre du Web, et les DOI (Digital Object Identifier), dispositif fermé et commercial.

  • Les pratiques actuelles de création des URL, en particulier quand elles sont liées à un logiciel spécifique ou à une organisation "physique" d'un site à une date donnée, rendent difficiles la généralisation de cette méthode puisque l'URL est sujette à des modifications. Si l'application de bonnes pratiques[10] permet de répondre aux problèmes les plus courants, pour les dispositifs à vocation pérenne la solution consisterait à adopter le principe des URI.
  • Le système du DOI, utilisé notamment dans le domaine scientifique à travers l’agence Crossref, repose sur une identification associée à la localisation des ressources. Le dispositif propose à la vente, des identifiants uniques essentiellement à destination des éditeurs de revues puis plus récemment aux éditeurs de monographies.

Impacts

  • Le principe des identifiants uniques facilite l'interopérabilité entre les systèmes et entre les fonds ou catalogues. Par exemple on sera capable de chercher quel article cite tel autre article. Ce type de fonctionnalités dites de Crosslinking (liens croisés) permet de naviguer dans un écosystème documentaire - limité toutefois au système d'identification choisi. Un travail sur l'interopérabilité entre ces systèmes reste à développer.
  • Pour exploiter pleinement ces techniques, il faut par ailleurs que les ressources soient correctement décrites à travers différentes métadonnées qui leur sont rattachées. Dans le cas contraire, le document devient impossible à retrouver. Les métadonnées transportées par les logiciels et ne reposant pas sur un minimum de normalisation peuvent être erronées ; elles sont souvent très pauvres. Il est donc fortement recommandé d'utiliser au minimum le format Dublin Core qui dans sa version normalisée ISO 15836, propose un jeu de 15 éléments. Le format ONIX[11], le standard de l'industrie du livre, cumule quant à lui des informations bibliographiques alignées à celles du Dublin Core mais aussi commerciales et promotionnelles [12].

Valoriser le texte en ligne : formats et protocoles[modifier | modifier le code]

Pour valoriser les textes en ligne, on utilise plusieurs stratégies. En particulier, on travaille sur la typographie et l'accessibilité. On doit également travailler sur les protocoles d'échanges de données (interopérabilité), comme l'OAI-PMH, sur les formats d'échanges de données, comme l'OPDS (Bookserver)[13], le Dublin Core, ONIX[14]. Interopérabilité, accessibilité, pérennité des documents… doivent répondre à des normes spécifiques au Web et être standardisées. C'est la tâche du W3C.

OAI-PMH[modifier | modifier le code]

L'OAI-PMH permet d'échanger les notices de ressources par le biais d'entrepôts en ligne. Les spécifications en sont publiques[15].

L'interrogation des dépôts utilise le protocole HTTP et les résultats s'affichent en XML. Le tableau suivant reprend les différents verbes et arguments utilisables, ainsi que quelques exemples[16].

Verbe Rôle Arguments
GetRecord Récupération d'un enregistrement donné.
  • identifier
  • metadataPrefix
Identify Informations sur l'entrepôt de données. Aucun
ListIdentifiers Récupère la liste des identifiants disponibles.
  • from : date de début
  • until : date de fin
  • metadataPrefix
  • set
  • resumptionToken
ListMetadataFormats Demande la liste des formats de métadonnées disponibles. Sans paramètres tous les formats disponibles pour au moins un item sont retournés. Avec le paramètre identifier, ne sont retournés que les formats disponibles pour l'item concerné
  • identifier
ListRecords Retourne une liste d'enregistrements correspondant aux différents paramètres (dates, ensemble) demandés.
  • from : date de début
  • until : date de fin
  • metadataPrefix
  • set
  • resumptionToken
ListSets Demande la liste des ensembles disponibles sur un entrepôt. La réponse peut être sur plusieurs pages. resumptionToken

Cette norme permet donc de centraliser les notices de ressources mais pas leur contenu, ce qui en montre ses limites, par rapport à l'OPDS.

OPDS[modifier | modifier le code]

Internet Archive a mis au point un système ouvert qui permet de rechercher via un moteur d'index les livres qui sont disponibles à partir d'une multitude de sources. De cette sorte il permet d'interconnecter entre eux un certain nombre d'acteurs du livre : libraires, bibliothèques, moteurs de recherches et lecteurs. Les catalogues bookserver se présentent via le format OPDS. Bookserver permet de créer des catalogues et de les mettre à disposition des acteurs qui le souhaitent, pour une diffusion gratuite ou payante.

Ce format libre et ouvert est décrit sur Google code[17]  :

Logiciels compatibles avec le format OPDS.

Dublin Core[modifier | modifier le code]

Le format Dublin Core est une norme simple décrivant des ressources bibliographiques. La difficulté de décrire sans aucune ambiguïté des documents complexes est grande. Ces descriptions sont surtout destinées à être interprétées par des machines, et beaucoup moins par des humains. Cela implique d'utiliser des listes d'autorités et des schémas d'encodage connus. C'est pourquoi il faut recourir le plus souvent possible à une déclaration de "scheme".

Unicode[modifier | modifier le code]

L'Unicode est un jeu de caractère central dans le domaine de l'édition électronique. C'est un système de codage des caractères des différents alphabets utilisés dans le monde, assignant à chacun un identifiant numérique unique, quelle que soit la langue qui l'utilise. Cette norme d'encodage tend ainsi à l'universalité, son objectif étant de s'imposer comme standard en remplaçant les systèmes d'encodages appliqués auparavant dans différentes langues et pays. Cette uniformisation du code a pour objectif de permettre l'échange de documents électroniques à l'échelle mondiale, et ainsi adapte l'édition électronique à cette échelle.

W3C[modifier | modifier le code]

Le World Wide Web Consortium est un organisme d'experts qui standardise et développe les formats de données les plus importants pour écrire des pages Web.

Quelques éditeurs de livres numériques[modifier | modifier le code]

Quelques distributeurs et diffuseurs de livres numériques[modifier | modifier le code]

Article détaillé : Livre numérique#En France.

Édition numérique dans les pays en développement : les exemples de l’Inde et de la Chine[modifier | modifier le code]

Présentation[modifier | modifier le code]

L’Inde et la Chine font partie des pays en voie de développement les plus avancés par rapport à la question du numérique dans l’édition. D’un côté, l’Inde possède un capital humain bien préparé à l’environnement informatique ainsi qu’une industrie éditoriale et de plateformes en ligne solides. De l’autre, la Chine dispose d’un volume de marché exceptionnel, de grandes ressources économiques, et d’une aide importante de l’État. Elle est actuellement l’un des plus grands acteurs de l’édition numérique dans le monde. Toutefois, les deux pays sont confrontés à divers défis et difficultés selon leur contexte.

Situation de l’industrie éditoriale dans ces pays[modifier | modifier le code]

L’Inde se caractérise par son nombre important de maisons d’éditions (plus de 16 000). Ces dernières publient leurs ouvrages en différentes langues. L’Inde est le troisième pays producteur de livres en langue anglaise. Ses principaux canaux de distribution sont les éditeurs, les libraires et les représentants commerciaux mais il ne faut pas oublier de citer le web. La Chine possède quant à elle environ 600 maisons d’éditions d’État organisées en différents groupes et un peu plus de 10 000 maisons d’éditions privées, dont 300 sont de grandes tailles. Dans le domaine de l’édition électronique, seuls quelques labels d’État et un nombre réduit de labels privés ont l’autorisation de publier.

Contexte des pays par rapport au numérique[modifier | modifier le code]

Dans le cas de l’Inde, le pays connait un grand développement en ce qui concerne les Technologies de l’Information. Ceci est le résultat de plusieurs années d’investissement de l’État. Ces efforts se reflètent dans les opérations effectuées par les parcs de technologie software de l’Inde (STPI) et le ministère des Technologies de l’information, créés afin de fortifier les exportations de TI. Grâce à ces efforts, l’Inde est devenue un point mondial de services technologiques en ce qui concerne l’édition. C’est d’une certaine façon le cas de la Chine, qui grâce au faible coût de sa main-d’œuvre et de son marché intérieur en pleine croissance, fait en sorte que son industrie éditoriale soit aussi reconnue dans le monde. Ils sont notamment les premiers dans la production des e-readers.

Agents de la numérisation[modifier | modifier le code]

Ces deux pays comptent avec plusieurs corporations qui travaillent dès la production des dispositifs jusqu'à la production des textes sa distribution et sa vente. En Inde, on trouve des entreprises comme Data Outsourcing India, qui Font des taches de pré-production du livre, ou Flipkart pour la distribution et vente. En Chine, on compte avec la présence de Jinke (qui produit Hanlin un dispositif très populaire) entre autres. Pour la distribution et vente ils existent des sites comme Alibaba et Taobao.

En Inde, on peut signaler des sites comme BookGanga qui ont développé leur propre software de lecture. Il existe également des sites comme Infibeam qui affirme avoir dans son catalogue plus de 10 millions de titres, et serait la plus grande librairie du pays. Elle compte aussi avec son propre dispositif de lecture : il s’agit de Pi, une tablette à écran tactile et à encre électronique qui permet de lire en plusieurs langues indiennes. Cependant, Infibeam n’est pas le seul sur le marché : on peut citer DC Books, qui publie essentiellement en langue malayalam et qui a notamment fait des traductions de Vargas Llosa et de la saga d’Harry Potter. Son e-reader s’appelle Wink, qui fonctionne avec un clavier analogique et une interface préparée pour fonctionner en anglais et dans autres langues indiennes. La Chine compte pour sa part avec Shanda Interactive Entertainment qui a son portail de littérature en ligne (Shanda Literature), site composé d’une diverse variété d’écrivains et d´environ 10 millions de lecteurs actifs. Ce site internet contrôle environ 90 % de la littérature web en Chine.

L’état et le secteur public[modifier | modifier le code]

Un des intérêts principal de l’État indien est celui d’alphabétiser grâce aux avancés numériques. Nous pouvons donner l’exemple de l’année 2010 où le ministère du Développement des ressources humaines a présenté une tablette crée pour les étudiants, vendues à un prix accessible. Le gouvernement a aussi créé des institutions comme Le dépôt du ministère des Sciences de la Terre, bibliothèque numérique du Panjab, l’Institut indien des sciences, pour faciliter l’accessibilité des élèves aux dispositifs de lecture numérique. En Chine, comme nous l’avons déjà signalé, la relation de l’État avec la production numérique est liée. Dans le 11e plan quinquennal chinois, la priorité de l’Administration générale de la presse et de l’édition (GAPP) a été que tous les entreprises gouvernementales deviennent lucratives et surtout qu’elles accélèrent le pas vers l’électronique. Pour ce faire, le China Publishing Group (le groupe qui réunit tous les maisons d’éditions chinoises de l’État) a créé en avril 2010 son propre dispositif de lecture : le Dajia.

Les téléphones portables[modifier | modifier le code]

En Inde, le confort numérique n’est pas encore optimal : pas de connexion fixe à Internet, pas d’e-readers ou de tablettes. Toutefois, un marché est en pleine expansion : celui des téléphones portables. En effet, il y avait fin 2010 environ 752 millions d’utilisateurs de cellulaires. L’avancée importante de la téléphonie mobile en Inde a ainsi conduit de nombreux portails web à adapter leur interface aux téléphones portables. Nous pouvons par exemple citer Vodafone qui commercialise toute une série de Momics, intégrés à la section « Films et Télévision » de son site web. La plupart de ces bandes dessinées peuvent ainsi être téléchargées après envoi d’un simple SMS. Autre exemple : celui de MobileVeda, une start-up indienne qui a mis en œuvre depuis 2006 différents projets d’éditions pour téléphones portables.

En Chine, les contenus pour téléphones portables constituent environ 40 % du total de l’édition électronique. Les trois opérateurs chinois (China Mobile, China Unicom et China Telecom) disposent chacun d’un portail d’applications et proposent à leurs clients un éventail de choix parmi les lectures électroniques. Cependant, ils ne sont pas les seuls : Les sites Byread et EMZ, par exemple, alimentent toute une communauté de lectures virtuelles offrant à leurs visiteurs la possibilité de télécharger des publications sur leur téléphone.

Enjeux et propositions[modifier | modifier le code]

En Inde, de nombreux éditeurs n’ont pas encore numérisé leurs catalogues. La raison principale de ce retard est la peur du piratage qui représente un problème important dans ce pays. Cette peur est toutefois légitime, car l’édition papier connait un problème de copies illégales. Ainsi, 25 % des livres imprimés en Inde seraient des copies illégales. Cependant, le piratage est dû en partie aux maisons d’éditions qui ne tiennent pas compte du contexte économique. Distribuer des e-books avec DRM à 10 dollars pièce dans une région où les livres papiers se vendent à la moitié de ce prix est absurde. De toute évidence, il faudrait donc viser dans un premier temps le marché des téléphones portables, puisque nous avons vu précédemment que celui-ci était actuellement en plein essor.

En Chine, le piratage numérique est aussi un facteur qui inquiète l’ensemble des labels chinois. Pour preuve, il existe au sein de ce pays plus de 530 000 sites proposant des livres piratés.

L’Inde comme la Chine connaissent également des difficultés pour élaborer des marques qui soient attractives à l’extérieur de leur pays et ont donc du mal à conclure des partenariats avec des marques étrangères, chose qu’il faudrait pouvoir parvenir à changer à l’avenir.

Tendances[modifier | modifier le code]

En Inde, l’émergence d’une nouvelle classe moyenne, avide de hardware et de contenus à la fois interactifs et modernes, laisse présager une croissante sophistication de la technologie indienne et la progressive entrée en interaction des producteurs de contenus avec les compagnies IT qui pourraient jouer un rôle de catalyseurs pour l’édition numérique indienne de demain. On peut aussi facilement imaginer que de nombreuses expériences de diffusion des textes numériques verront bientôt le jour par le biais des téléphones portables, au vu de la croissance exponentielle de ce marché.

Concernant la Chine, il important de signaler qu’il existe dans ce pays une nouvelle classe moyenne qui s’incorpore rapidement au marché. Il est donc possible qu’une expansion très accélérée de la littérature en ligne ait lieu. Ceci aura pour conséquence une recrudescence de procès par rapport aux questions des droits d’auteur, mais également peut-être d´une baisse importante de la vente de livres imprimés, ainsi que d’un avenir incertain concernant les nombreuses librairies du pays.

Bibliographie[modifier | modifier le code]

  • Marie Lebert, Les Mutations du livre à l'heure de l'internet, Montréal, Net des études françaises,‎ 2007
  • Marin Dacos, Pierre Mounier, L'Édition électronique, Paris, La Découverte, coll. « Repères, 549 »,‎ 2010, 128 p. (ISBN 978-2-7071-5729-4)
  • (en)2001 : In Oldenburg's Long Shadow : Librarians, Research Scientists, Publishers, and the Control of Scientific Publishing

Version française (2009) : A l'ombre d'Oldenburg : Bibliothécaires, chercheurs scientifiques, maisons d'édition et le contrôle des publications scientifiques

  • Hubert Guillaud, Alain Pierrot, Bob Stein, Nova Spivack, Joël Faucilhon, Milad Doueihi, Philippe Aigrain, Robert Darnton, Tim O'Reilly, Andrew Savikas, Fabrice Epelboin, André Gunthert, Pierre Mounier, Janet Stemwedel, Antoine Blanchard et Jean Sarzana. Sous la direction de Marin Dacos, Read/Write Book. Le livre inscriptible, Marseille, Cléo, coll. « Edition électronique »,‎ 2010 (réimpr. 1ere éd.), 2e éd., 198 p. (ISBN 978-2-9536419-0-5)
  • Bernard Poulet, La Fin des journaux et l'avenir de l'information, Paris, Editions Gallimard, coll. « Le Débat »,‎ 2009, poche, 217 p. (ISBN 978-2-07-012272-1)
  • Olivier Bomsel, Gratuit ! Du déploiement de l'économie numérique, Paris, Editions Gallimard, coll. « Folio actuel »,‎ 2007, 301 p. (ISBN 978-2-07-033957-0)
  • Stiegler Bernard, Giffard Alain, Fauré Christian, Pour en finir avec la mécroissance, Paris, Flammarion Lettres, coll. « Essais »,‎ 2009, 305 p. (ISBN 978-2-08-122492-6)
  • Lise Vieira, L'Édition électronique, de l'imprimé au numérique, évolutions et stratégies, Saint-Etienne, Presses universitaires de Bordeaux, coll. « Labyrinthes »,‎ 2004, 188 p. (ISBN 978-2-86781-342-9)
  • Octavio Kulesz, L’édition numérique dans les pays en développement, Alliance internationale des éditeurs indépendants,‎ 2011, 167 p. (ISBN 978-2-9519747-5-3)
  • Lorenzo Soccavo, Les mutations du livre et de la lecture, Uppr Editions, 2014, 40 p., (ISBN 978-2-37168-015-9)

Notes et références[modifier | modifier le code]

  1. Marie Lebert, Les mutations du livre à l'heure de l'internet, Net des études françaises, Montréal, 2007
  2. Project Gutenberg: Timeline Events sur www.gutenbergnews.org
  3. (fr) « La bibliothèque », sur books.google.fr (consulté le 5 octobre 2010)
  4. http://www.opencontentalliance.org/
  5. Centre de traitement de données
  6. Chiffres de 2010, voir http://www.itu.int/en/pages/default.aspx
  7. http://www.newswiretoday.com/news/47193/
  8. Perception sobre el clima empresarial editorial y tendencias a corto plazo - Boletin 9, CERCLALC, octobre 2010, p. 8.
  9. Marin Dacos, Pierre Mounier, L'Édition électronique, La Découverte, coll. « Repères, 549 », Paris, 2010, p. 71. (ISBN 978-2-7071-5729-4)
  10. Cool URI for the semantic web, 2008. Consulté le 31 octobre 2011
  11. Site de l'éditeur du format ONIX
  12. L'utilisation d'ONIX pour vos livres imprimés et numériques, OnixEdit, consulté le 31 octobre 2011
  13. (en) « A Future for Books -- BookServer », sur www.archive.org (consulté le 5 octobre 2010)
  14. (en) « Site officiel de ONIX », sur www.editeur.org (consulté le 5 octobre 2010)
  15. Le document de référence est disponible sur Openarchives.org : The Open Archives Initiative Protocol for Metadata Harvesting, http://www.openarchives.org/OAI/openarchivesprotocol.html
  16. Pour d'autres exemples : Laurent Dousset, Jean-Luc Minel, Stéphane Pouyllau, Richard Walter, Le Guide des bonnes pratiques numériques, http://www.tge-adonis.fr/wiki/index.php/Guides
  17. (fr) « Project Hostingon google code », sur code.google.com (consulté le 5 octobre 2010)

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Général
Livre numérique
Formats de livres numériques EPUB - PDF - PRC/MOBI
Liseuses Kindle DX - Sony Reader - Iliad - Digital Reader 1000 - Cybook Gen3 - Cybook Opus - Nook - Amazon Kindle
Technologies et normes Papier électronique - Unicode - Open Publication Structure
Portails de revues Persée (portail) - Cairn.info - Érudit (édition) - Revues.org
Bibliothèques numériques et projets de numérisation Google livres - Gallica - Europeana - Projet Gutenberg - Association des bibliophiles universels