Aller au contenu

Utilisateur:Cleope

Une page de Wikipédia, l'encyclopédie libre.
Émilie Simon
une illustration sous licence libre serait bienvenue
Naissance

Paris
Décès
-
-
Nom de naissance
Émilie Simon
Nationalité
Française
Activité
Chanteuse
Formation
Conservatoire de Paris
Mouvement
Électro-pop

Mutations du livre et diffusion numérique
Marin Dacos
À lire : l'édition électronique et blog du master Monde du livre (AMU)


Cours n°1 - Introduction

Présentation Marin Dacos[modifier | modifier le code]

Marin Dacos[1], directeur du CLÉO[2] en charge du développement de quatre portails autour de l'Open edition.

Open edition
traduction exacte : tirage illimité. Métaphore incarnant l'idée de l'open access : les biens sont non rivaux.

A titre d'explication, on peut faire la comparaison entre un livre matériel et immatériel. Le premier est un bien rival en ce sens où lorsque je le prête, j'en suis dépossédé ; lorsque je veux le reproduire, j'altère l'objet. Le second est non rival : je possède toujours le livre lorsque je le prête. Je peux le reproduire à l'infini sans l'altérer (copie de fichier).

Les portails de l'Open edition :

Tous les objets publiés par ces portails relèvent de l'édition électronique.

Trois types d'édition selon M. Dacos :

  • Édition numérique (numérisation)
  • Édition nativement numérique (le processus de fabrication et le format de la publication sont numériques)
  • Édition nativement en réseau (née sur le réseau et vit par le réseau - bénéficie de qualités propres à l'espace public qu'est le web)

Notons qu'au cours de l'histoire de l'édition électronique, aucune de ces formes n'a remplacé les autres.

L'édition nativement en réseau[modifier | modifier le code]

L'exemple de Wikipédia[modifier | modifier le code]

Wikipédia, l'encyclopédie numérique participative est régie par le régime de la licence Creative Commons ou CC (BY SA : paternité + share alike).
Cela signifie que les contenus de Wikipédia sont libres d'accès et d'utilisation, à condition de nommer l'auteur/les auteurs des articles utilisés et de partager l'objet créé en le maintenant sous licence CC.
En somme, si je le souhaite, je peux extraire autant de contenus Wikipédia que je le souhaite pour un usage spécifique de mon choix. Par exemple, je peux publier un livre, créer une application, etc. Wikipédia est un bien non rival, il est public et non "privatisable". Ces principes sont renforcés voire permis par la licence CC.
Il faut réaliser combien le régime de la licence est inédit dans le monde de l'édition, traditionnellement régi par les code de la propriété intellectuelle, le principe de contrat, la cession de droits.
Notons par ailleurs que le régime CC n'est pas anti-économique ni anti-commercial. Des business se sont créés par le biais de la licence CC de Wikipédia, comme DBpedia.
L'un des véritables objectifs de cette licence est de supprimer un maximum de transaction dans les partages d'objets qui relèvent du droit d'auteur, et de fait, de supprimer les coûts de ces transactions.

  • Exemple : Imaginons que Wikipédia ne relève pas de la licence CC. Je suis institutrice et dans le cadre de mon cours, je veux présenter à mes élèves une photo. Dans un article intéressant de Wikipédia, une photo d'illustration serait parfaite pour cela. Le système juridique impose alors que j'écrive à l'auteur de l'article/de la photo pour lui demander l'autorisation de l'utilisation de l'image. La démarche est lourde, pour moi comme pour l'auteur qui doit répondre à chaque demande qui lui est faite.

La licence CC simplifie considérablement le processus puisque dès la publication de l'objet sous licence, l'information est claire : les règles d'utilisation à respecter sont précisément indiquées et tout ce qui n'est pas explicitement mentionné est par automatisme autorisé (si l'utilisation commerciale de l'objet n'est pas ouvertement interdite, par exemple, c'est donc qu'elle est autorisée).

Licence Creative Commons
Licence à la carte. L'auteur cède un certain nombre de droits sur son œuvre. Licence qui régit une œuvre au sein du régime des droits d'auteur, elle définit tous les objets qui relèvent du droit d'auteur. La qualité de l'œuvre n'entre pas en compte, au même titre que la destination de l'œuvre, sa technique...

La protection d'une œuvre prend effet au moment-même où elle est produite. Contrairement au brevet, le droit d'auteur sur une œuvre ne se dépose pas. C'est à la naissance d'un conflit que l'auteur doit prouver que sa création est originale et donc protégée de fait.
Un auteur qui décidé d'apposer la licence CC à son oeuvre est toujours soumis aux clauses relatives au droit d'auteur ; toutefois, il cède une licence stricte et définie, de manière unilatérale (par opposition au contrait où deux partis signent).
Les règles d'usage définies par l'auteur et visibles par le public :

  • Droit de paternité (CC BY). L'auteur doit être mentionné à chaque utilisation de l'œuvre. Cette règle est automatique si aucune autre condition d'utilisation n'est définie par l'auteur.
  • L'œuvre ne peut être modifiée (no derivative)
  • L'œuvre ne peut faire l'objet d'un usage commercial (no commercial)
  • L'œuvre partagée par un tiers doit être à nouveau soumise à la licence CC, dans les même conditions d'utilisation (share alike).

Notons que plus les contraintes imposées sont nombreuses, moins il y a d'usages possibles. Par exemple, si un musicien exige qu'aucune modification ne soit apportée à ses morceaux, il sera impossible pour un artiste de les sampler dans une œuvre originale.
La licence s'exprime en pictogrammes (symboles qui permettent l'identification des conditions), en droit (formulation des conditions en langue juridique), en français (explicitation des picto en langue française).

  • Valeur juridique :

Si les conditions d'utilisation sont enfreintes, l'auteur peut intenter un procès et a toutes les chances de gagner. La licence a un véritable poids juridique, renforcé par le droit d'auteur qui constitue toujours une protection. Toutefois, on notera la difficulté de définir strictement certains usages. L'usage commercial, par exemple, peut prendre divers contours et il est parfois complexe de l'identifier comme tel. Dans ce cas, l'ambigüité d'une exploitation peut rendre difficile la défense d'une œuvre dans une démarche juridique.

Cours n°2 - Définitions et Le texte numérique

Rappel de définitions[modifier | modifier le code]

DRM

Digital Rights Management, Gestion des droits numériques en français. Il s'agit d'un dispositif technique (ou logiciel) qui permet de protéger les œuvres des copies non contrôlées par le vendeur.

  • Procédé :

Cryptage du contenu du fichier pour le rendre illisible sans une clé d'accès. Un logiciel décrypte ce contenu après vérification que l'utilisation est autorisée. Concrètement, les logiciels des vendeurs (Adobe, Apple, Amazon...) déterminent si oui ou non l'utilisateur a le droit de lire tel fichier.
Adobe Digital Edition est le logiciel de décryptage des DRM d'Adobe. Ce dernier autorise un nombre limité d'utilisations (5 machines). A la sixième, je dois obligatoirement désinstaller mon fichier de l'un des mes lecteurs...
Des affaires révélatrices :

En 2010, Amazon a retiré tous les livres 1984 des Kindle de ses clients car l'entreprise ne possédait pas les droits sur l'ouvrage. Ceci est un véritable [autodafé] ! Précisons qu'au-delà des ouvrages, ce sont toutes les annotations, "surlignages" et autres utilisations personnelles, qui ont été supprimés des liseuses.

  • "L'affaire de la littérature érotique"

En 2011, à cause d'une controverse causée par un ouvrage considéré comme outrancier, Amazon stoppe les ventes dudit livre... et renouvelle l'autodafé.

L'application du lauréat, un caricaturiste, a été refusée et, n'ayons pas peur des mots, censurée par Apple qui la trouvait trop immoral. Finalement, la firme est revenue sur sa décision, sous la pression de la puissance souveraine d'un prix Pulitzer.

Le concept du Read/Write Book, le livre inscriptible.

Imaginé par Hubert Guillaud ?
Le concept part d'un constat, à travers l'observation de trois supports de lecture et de leurs caractéristiques intrinsèques :

  • Le livre papier

Peut contenir des inscriptions, des pages cornées, notes, griffonnages... Ces inscriptions sont uniques et non distribuées (privées).

Le serveur émet les informations aux lecteurs. Il s'agit de France Telecom, celui qui écrit, qui possède le droit d'inscription comme valeur marchande. La communication est ici verticale, l'usager ne fait que lire.

  • Le web

"Read/Write Web" : le web est inscriptible. Les utilisateurs peuvent produire du contenu, d'égal à égal (web 2.0). La communication est désormais horizontale.

A l'instar du web inscriptible, Marin Dacos et Hubert Guillaud imaginent le livre inscriptible.
Dans le domaine de l'édition électronique, le livre bénéficie de couches informationnelles supplémentaires à son contenu propre. Ces informations peuvent être rendues publiques. La citation est un exemple représentatif de cette idée : le livre peut "savoir" que je le cite, tout comme les blogs aujourd'hui en sont capable (grâce aux rétroliens ou trackback ou ping). En effet, un blog cité peut savoir que le blog citant a renvoyé un lien vers son blog/article. Le commentaire, la citation, est rendu-e public-que si l'auteur d'origine juge la publication pertinente. Dans ce cas, tout le débat nourri autour de l'article est public, ce qui présente un véritable intérêt.
Ces "inscriptions" sont également les commentaires, les notations par étoiles, les "like", les tags...

L'epub et le PDF

Ce sont deux formats de fichier. Le premier est recomposable, le second composé.

  • Le format PDF :

Il est immobile, figé. Il a été créé pour faciliter les échanges de documents dédiés à l'impression (il protège le fichier qui ne sera pas altéré lors d'échanges). Pour cette utilisation bien spécifique, le PDF est idéal. Mais sa caractéristique, non recomposable, le rend inadapté à la production de document dédiés à une lecture sur écran. En effet, aujourd'hui le parc des machines disponibles proposent des écrans de formats divers (smartphones, tablettes, ordinateurs, liseuses...). Avec un document PDF, il est impossible d'adapter le document à chaque type d'écran. Conséquence, la lecture n'est pas rendue optimale voire devient inconfortable.

  • Le format epub :

Composé quasi exclusivement de HTML, l'epub n'est pas figé. Il recompose les fichiers en identifiants les formats de page des supports de lecture. Il identifie les limites de l'écran. Ainsi, le texte sera toujours contenu dans une zone de lisibilité, délimitée par les bords latéraux de l'écran.

DBpedia

Base de données structurées, composée d'informations extraites de Wikipédia. DBpedia a construit, notamment à partir des infobox [4], un système qui structure les données et centralise les informations éparses de Wikipédia. La base de données permet alors de répondre à des requêtes telles que le listing de toutes les capitales du monde.

Les métadonnées (que nous nommerons ici MD)

"Données sur les données".
Ces données permettent de décrire les objets numériques. Pour un livre, les MD seront l'ISBN, le titre, l'auteur, la pagination, la date de sortie, etc.
Les métadonnées sont fondamentales : sans descripteurs, l'information est orpheline, inaccessible. Au contraire, plus l'information est riche, plus l'usage à distance de l'objet numérique par une personne, dans un autre environnement, sera facile/possible. Aujourd'hui, elle représentent un enjeu économique considérable.
Ces MD doivent être structurées par un format spécifiques. Les plus répandus sont Dublin Core et ONIX.

Le livre-application

Avant tout une application, donc un logiciel.
Lancement du livre, exécution = logiciel.
Codé en binaire --> converti dans un langage interprétable par la machine. Un langage par plateforme (mac, windows, android...).
Non indexable puisqu'on ne peut pas faire de recherche au sein d'un texte de logiciel (exemple des jeux vidéo).
Le livre-application le plus classique = le dictionnaire.
Livres-application sont des technologies jetables car pas encore de standardisation : des technologies remplacent les autres. Exemple du CD-rom, aujourd'hui quasi disparu. Plus récemment le FLASH (format propriétaire développé par Adobe), qui avait pignon sur rue il n'y a pas si longtemps. On pensait même que le FLASH (offrant beaucoup de possibilité de création) allait remplacer le HTML (trop figé). Or, il est en train de disparaître aujourd'hui ou sera à termes cantonné à des usages bien particuliers. Il est blacklisté par Steve Job (considérations d'entreprise, concurrence) : inutilisable sur les produits Apple.
Microsoft a inventé un format équivalent : SILVERLIGHT (n'a pas pris).
Question du HTML 5, permettant, lui, une utilisation plus universelle. Développé par Tim Berners Lee, inventeur du web au CERN. Créateur du W3C, organisme qui produit des normes pour le web, notamment pour le XML et HTML. Normes relatives à l'accessibilité, entre autre. Le W3C regroupe des entreprises, asso, états. Obj : créer des langues communes pour des objets communs (HTML 5).
Berners Lee a développé le Web Accessibility Initiative (WAI) : contient un guide pour rendre les contenus accessibles à tous (au sens strict du terme : à ceux qui ont des écrans différents des autres, aux aveugles, aux amputés, etc.). Propose des fonctionnalités diverses, adaptées à tous les types d'utilisateurs.

Pas de copier/coller dans les livres-application.

Dans l'édition électronique (excepté livre-appli), on distingue totalement le fond de la forme.

  • Le fond est traité en premier temps : le texte, la structure du texte... Un moteur de rendu permet d'interpréter alors la forme à partir du fond.
  • C'est le modèle SSP (Single Source Publishing) : publication avec une seule source. Fond > instructions de rendu > autant de formes que désiré.

Mise en situation : j'ai un fichier XML = livre qui contient des instructions de fond. Je veux en faire un epub. Première instruction de rendu : transformation de mon XML en epub. Je veux également un fichier Mobi. Deuxième instruction de rendu : transformation de mon XML en Mobi. Je veux aussi un site web : nouvelle instruction de rendu. Enfin, je veux de la PAO : nouvelle instruction de rendu.

  • De la PAO à l'epub

Conception PAO (indesign) en 2D. Or, la conception d'epub se fait en flux (1D). Pour passer du format indd à l'epub, il faut linéariser le document PAO. Indesign est de la forme, l'epub est conçu en fond. Incompatibilité qui rend le circuit de création très fragile.

SSP
à compléter

Le texte numérique[modifier | modifier le code]

1. Définition

  • Quasiment immatériel (n'existe pas en dehors d'un matériel/terminal de lecture + définit par des octets qui sont une modalité matérielle de l'information immatérielle).
  • Reproductible quasiment sans aucun coût spécifique. Le coût de la reproduction est très faible (et rapide), contrairement à la reproduction papier (qui, de surcroît, dégrade l'objet si cela est fait en amateur).
  • L'info numérique circule avec une grande fluidité.
  • Peut se doter de couches successives : est annotable en public ou en privé. Est entouré d'informations (cf : Read/Write Book).
  • Hypertextuel : capable de citer ou d'être cité (flux entrant ou sortant). Texte "liable".
  • Indexable à tout moment et sans cesse selon des logiques et algorithmes qui évoluent.
  • Soumis à l'économie de l'attention et non plus de la rareté. Ce qui devient rare n'est plus le document mais l'attention du lecteur (il y a plus de documents que de lecteurs).

2. Caractéristiques du texte électronique idéal

  • LISIBLE

L1 : Décrit par un format ouvert (pas de DRM). Toute société, université, personne, peut développer un public autour de ce format ouvert --> connu de tous, accessible à tous. Et donc radicalement à l'opposé des applications et livres-appli qui ne peuvent tourner que dans un environnement unique (Androïd, iOS).
L2 : Recomposable. Le plus autonome possible par rapport aux résolutions des écrans.
L3 : Conservable. Si je ne peux conserver le texte, je ne peux pas le lire (DRM). Exemple de Numilog.com qui a créé la "chronodestruction" : un livre numérique emprunté dans la bibliothèque Numilog s'autodétruit au bout de 8 jours (il n'est plus décryptable).

  • MANIPULABLE

M1 : Il est indexable et cherchable (ce que ne permettent pas les DRM ou les livres-appli).
M2 : Copiable et collable. Si je veux citer un livre, je dois pouvoir copier/coller si je le souhaite.
M3 : Annotable et inscriptible. Surligner une zone, ajouter un commentaire... Amazon et Apple autorise l'inscription mais dans le cadre de silos propriétaires qui empêchent de conserver les annotations lors du passage d'une marque à l'autre. Le système est clôt et rend les utilisateurs toujours plus dépendants des deux firmes.

  • CITABLE

C1 : Identifiable. Pour le livre papier, l'ISBN est un identifiant ; pour les publications en série, il y a l'ISSN. Le texte numérique éprouve la nécessité de trouver un identifiant équivalent, adéquat, efficace et fiable. Aujourd'hui, plusieurs types d'identifiants existent mais manquent de fiabilité (ISBN électronique, URL, DOI, etc.).
C2 : Correctement décrit, grâce à de bonnes métadonnées.
C3 : Interopérable. Les textes échangent des données (exemple des rétroliens).

Cours n°3 - HTML & Dublin core

Initiation au HTML[modifier | modifier le code]

HTML

Langage de programmation en balises.
Convention incontournable : lors de la création d'un doc HTML, il faut indiquer dans quelle version HTML on s'exprime (HTML 4, HTML 5, XHTML - Strict ou transitional...). Toutes les fichiers HTML doivent s'ouvrir par l'instruction <html> et finir par </html>.
Travail pratique : créer un document HTML à l'aide du logiciel libre Geany (sur le site : releases/windows binaries).

  • Les balises :

--> <head> </head> : balise contenant les métadonnées du doc. MD de base : le titre.
--> <title> </title> : titre du document
--> <body> </body> : corps du doc
--> h1 /h1 : titre de niveau 1
--> p /p : délimitation de paragraphe
--> em /em : italique
--> strong /strong : gras + créer un lien hypertexte
+ insérer une image (depuis le disque dur)
+ insérer une image (depuis le web)
+ faire des listes ordonnées et non ordonnées
+ définition de termes

Pour s'exercer, notice d'utilisation des balises sur :

  • Les jeux de caractère
ASCII

L'ASCII est une norme d'encodage des caractères ancienne et non exhaustive. Elle reconnait 255 caractères max, dont caractères spéciaux et lettres accentuées. Pour ajouter un caractère non reconnu (cyrillique par exemple), il faut le substituer à un autre (impossible d'excéder 255 caractères).

L'UNICODE

Pour pallier aux limites de la norme ASCII, l'UNICODE a été créé. Il permet l'ajout de caractère sans en supprimer aucun autre, autorisant le dépassement de la limite de 255 caractères auparavant imposée. Principe : création d'un nombre par caractère.

NOTES[modifier | modifier le code]

  1. Co-auteur de l'ouvrage L'édition Électronique, éd. La Découverte, coll. Repères, 126p, 2010
  2. Centre pour l'édition électronique ouverte
  3. Du nom du célèbre roman éponyme de George Orwell
  4. Système proposé par Wikipédia, qui conditionne la mise en forme des informations. Par exemple, la "fiche d'identité" d'un artiste est permise par une infobox où les informations sont prédéterminées, il n'y a plus qu'à les compléter.