Code Baudot

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
bande de papier avec des trous représentant les "Code Baudot"
Le clavier et ses cinq touches.

Le code Baudot est dans l'histoire un des premiers codes binaires (ou plus exactement code de Gray) utilisé grâce à une machine. Il est aussi appelé code télégraphique Alphabet International (AI) no 1 ou Alphabet International (AI) no 2 ou code CCITT no 2.

C'est un code binaire : chaque caractère est codé par une série de 5 bits (0 ou 1). Ce qui permet 25 = 32 combinaisons. Ces 32 caractères ne suffisent pas pour coder les lettres (26), les chiffres (10), les signes opératoires (+-/x=), la ponctuation (, ;.:!?), et les autres symboles (&, #..) ; le code Baudot utilise donc deux jeux de caractères appelés Lettres (Lower Case) et Chiffres (Upper Case). Le jeu de caractères Chiffre comprend les signes opératoires et de ponctuation et les autres symboles. Deux caractères, Inversion Lettres et Inversion Chiffres (code 31 et 27), permettent le passage d'un jeux de caractères à l'autre.

Il s'agit donc du premier codage de caractère mécanisé.

Évidemment, l’inconvénient réside dans des commutations fréquentes. D’autre part, ce code, bien qu’il soit plus riche que le code morse, ne traite pas les minuscules et certains symboles.

Historique[modifier | modifier le code]

Le premier code Baudot a été développé par Émile Baudot en 1874 : il s'agissait de l'Alphabet International no 1.

Les caractères étaient composés à l'aide d'un clavier à cinq touches, où chaque touche correspondait à l'un des cinq bits de chaque caractère.

Basé sur la technologie du ruban perforé, il n'est plus utilisé.

Objectif[modifier | modifier le code]

Cet appareil a permis de composer des dépêches en parallèle (page 531).

Utilisation du multiplexage.

Il a permis d'atteindre 3000 mots par heure en duplex contre 1000 mots en morse Duplex (page 532). Ce chiffre s'obtient en comptant 25 mots pour 165 lettres. Cette vitesse était obtenue par une roue qui permettait de multiplexer plusieurs communications (de l'ordre de quatre ou six).

Le dispositif était basé sur un clavier de cinq touches pouvant être pressées simultanément, et qui chacune pouvait porter un courant positif ou négatif (voir bit). Ce code de 32 valeurs était doté de 2 plages de 28 caractères imprimables et de quatre code de contrôle. Les quatre codes de contrôle permettaient (page 533)[1] :

  • de passer du mode chiffre au mode lettre et vice versa, ou, de gérer une espace −−−−+ et −−−++  ;
  • de générer une erreur −−−++  ;
  • ou un état de repos −−−−−.

Évolution[modifier | modifier le code]

Vers 1901, le code Baudot original a été modifié par Donald Murray (en) qui réorganisa les caractères, ajouta de nouveaux symboles, et introduisit les jeux de caractères. Comme il souhaitait utiliser un clavier de machine à écrire, il n'y avait plus de lien entre le code lui-même et la disposition des touches. Il organisa donc les caractères de façon à ce que les transitions les plus courantes entre caractères génèrent un nombre minimal de transitions[pas clair] entre les cinq bits du code, ce qui minimise l'usure du matériel.

La Western Union modifia le code de Murray, en éliminant certains caractères. Le code obtenu est le code Baudot actuel, le code CCITT no 2. On présente ici le code US TTY, très proche du code CCITT. Il en diffère par une inversion (BEL et '), et des définitions additionnelles dans les FIGS (#, & et !), laissées volontairement non définies par le CCITT no 2 pour permettre des usages nationaux.

En hommage à Émile Baudot, une partie de son nom désigne l'unité de mesure du débit de signal, le Baud (symbole Bd).

Utilisation et application[modifier | modifier le code]

En décembre 1899, après avoir expérimenté avec succès l'appareil entre Marseille et Alger, il est décidé de développer l'usage de l'appareil Baudot sur les câbles sous-marins d'Algérie[2].

L'appareil Baudot peut être utilisé avec deux fils: un fil sert alors à la transmission, et l'autre à la réception[3].

Le code Baudot est utilisé dans le réseau Télex. Il est également mis en œuvre dans certaines versions du radiotélétype.

Le principe de perforation sur un nombre fixe de bits a été repris, en changeant à la fois le système de codage et le format du support, dans le système des cartes perforées.

Inspire le Manchester Mark I.

Variations et standardisations[modifier | modifier le code]

Le principe de code Baudot basé sur cinq bits, avec deux contextes (lettres et chiffres) a continué à être utilisé avec certaines variations. Pour une bonne compréhension entre des parties différentes, une standardisation a dû s'imposer.

Le principe du code Baudot est repris à un niveau dans les Alphabet international no 1 et no 2.

À un niveau local, on le retrouve dans le Code US TTY.

Alphabet international n°1[modifier | modifier le code]


Le code Baudot se compose de 31 symboles et d'un code de changement de jeu de caractère.

Les cinq premiers chiffres sont codés sur trois bits dans un ordre d'origine méconnue. Les cinq chiffres suivant sont codés dans le même ordre, mais avec le bit no 4 positionné.

Aucun lien apparent ne semble unir le codage des lettres et le codage des chiffres.

Les lettres sont codées en classant les voyelles et les consonnes séparément dans l'ordre alphabétique, et en suivant le code de Gray, trois quart de siècle avant que celui-ci ne soit breveté aux Etats-Unis.

Variante[modifier | modifier le code]

Le code Baudot original a donné lieu à des variantes, (Western Union), etc.

Le code de la British Post Office est détaillé dans la table de droite.

Le code de Murray et l'Alphabet international n°2[modifier | modifier le code]

L'alphabet international no 2 est incompatible avec l'Alphabet international no 1 (Code Baudot original).

Les lettres de l'Alphabet international no 2 ne suivent aucune logique apparente, mis à part une ressemblance forte avec ET AOINSHRDLU bien connue à l'époque. Ces lettres ne sont représentées qu'avec deux bits positionnés, et un seul pour E et T.

Il faut donc comprendre que les combinaisons nécessitant le moins de perforations sont associées aux caractères les plus fréquents[11] [12]

Chaque lettre prenait un demi-pouce sur lesbandes perforées[13].

Le télégraphe de Murray a été en compétition avec nombreux d'autres systèmes. Mais, il permet d'effacer un caractère sans que cela n'apparaisse dans le message final, pour plaire aux business men. Il a été essayé par les administrations allemandes et britanniques (y compris en Inde), notamment sur le cable Londres-Edinbourg durant quinze mois, mais ausis sur le cable Emden-Londres. Le jeu complet d'appareil coute alors 1400 livres britanniques. Le jeu complet d'appareil coute entre 700 et 800 livres britanniques. A titre de comparaison le clavier Morse ne coute que dix livres environ. Ce système a été développé en partie à Sydney, New-York, Londres et Berlin. Le système a notamment intéréssé l'ingénieur Kraatz, et le Kolnische Zeitung. Le système permettait également d'écrire en forme e page à un rythme de 120 mots par minute, dans un sens (donc 240 mots en cas de transmission dans les deux sens (duplex) ), sur une distance d'un milliers e miles britanniques[14].

Murray a également déposé un brevet sur la synchronisation automatique permettant de perfectionner les systèmes Baudo et Picard[15].

Le code Baudot a été utilisé en France, dans les capitales européennes majeures ainsi que dans différents pays notamment la Russie, l'Inde et le Brésil. En France, avec le système Baudot plusieurs villes peuvent être branchées sur une seule ligne (un seul cable). De plus, une des avancées majeures de Murray est le fait de perforer le message reçu, ce qui permet de le retransmettre automatiquement et sans erreur, vers plusieurs destinations. Dès 1914, la Western Union dispose d'un lien entre Boston et New-York, ce qui leur permet d'échanger 3000 messages par jour. Entre Londres et Birmingham, 5000 messages par jour sont échanges [16]. Ceci contribue à un effet de réseau.


L'Alphabet international no 2 associe les chiffres et les lettres de la même manière que le clavier Qwerty de machine à écrire.


L'Alphabet international no 2 finira par être remplacé par l'Alphabet international no 5, utilisant sept bits à la place de cinq.

Code US TTY[modifier | modifier le code]

Code US TTY

Le code US TTY est une adaptation régionale aux États-Unis. Il se distingue par la présences des caractères Livre (£), Dollar ($), Bel (Sonnerie), CR et LF, pour prendre en charge les deux éléments d'un retour à la ligne.

Comme le code de Murray, il correspond à une disposition de clavier QWERTY, en suivant l'ordre des chiffres 123456.

Controverse avec l'invention de Monsieur Mimault de Poitiers[modifier | modifier le code]

Une invention similaire a été développée et brevetée par Mimault de Poitiers.

Mimault avait inventé plusieurs alphabets, dont un basé sur le système binaire[17].

Le procès concernait notamment l'alphabet.

Mimault avait notamment déposé le brevet 1301 déposé le 5 juin 1876

  • système télégraphiques multiples, imprimeurs et écrivants basés sur des combinaisons mécaniques ou graphiques provenant de «(X+1) puissance m»
  • système télégraphiques multiples, imprimeurs et écrivants basés sur des combinaisons de la progression 1 : 2 : 4 : 8 : 16 [18].

La justice a considéré que le codage de Baudot était de même nature que celui de Mimault:

Le 18 décembre 1883, la cour de cassation s'est prononcée sur le procès opposant «M» à «B». «M» employé à l'administration des postes et des télégraphes. M a étudié les «effets électriques, variant de l'unité à 31, nécessaires à la transmission des 31 signes, lettres ou caractères indispensables pour la composition de la langue électrique.» La solution de M utilisait 8 fils conducteurs, pour suivre la progression géométrique 1, 2,4, 8, 16. «B» est employé de la même administration, et a construit «un télégraphe imprimeur présentant les mêmes propriétés», «qui se traduisait automatiquement par un appareil construit suivant la même progression géométrique».

Après l’utilisation (monopole) de l'appareil e monsieur «B» par l'administration dès postes, «le sieur M... intenta contre le sieur B... une instance en contrefaçon qui fut favorablement accueillie par le Tribunal delà Seine».

En date du 7 mai 1880, par arrêt La Cour de Paris s'est prononcée sur appel. Elle a estimé que «le moyen de M» , isolé de tout organe mécanique, était impuissant à produire quoi que ce soit et constituait «un principe abstrait et une loi purement théorique non brevetable». Elle a en conséquence infirmé la décision des premiers juges et déclaré qu'il n'y avait pas delà part du sieur B... contrefaçon de l'appareil M...

La Cour de cassation, saisie d'un pourvoi, s'est appuyée, d'abord, sur les constatations de l'arrêt attaqué, d'où il résulte : 1° que B... a pris pour point de départ de son système une partie au moins de celui de M... et notamment l'application de la loi de progression géométrique 1, 2, 4, 8, 16 ; 2° que la disposition de son combinateur est faite en vue de cette progression et qu'il obtient 31 signaux au moyen delà même progression mécaniquement appliquée ; 3° que par là l'appareil B... participe à certaines propriétés de l'appareil M..., qu'il existe en conséquence entre ces appareils certaines ressemblances au double point de vue du nombre des effets élémentaires à combiner et du résultat en vertu duquel on les combine.

La Cour suprême a conclu, de ces différentes constatations, que le brevet de M..., ayant pour objet une application nouvelle, soit de moyens, soit de principes connus, avait été valablement pris ; elle a jugé, par suite, que la loi du 8 juillet 1844 se trouvait violée, et elle a cassé l'arrêt de la Cour de Paris, avec renvoi devant la Cour d'appel d'Amiens[19].

Toutefois, la cours d'Amiens a abondé dans le sens de la cours de la Seine[20].

Le dernier pourvoi de Lous-Victor Mimault contre l'arrêt de la cours d'appel d'Amiens a été rejeté par la cour de cassation au profit d'Emile Baudot employé et de Dumoulin-Froment, constructeur[21].


Toutefois, le journal de la cours d'appel d'Amiens, laisse comprendre que l'alphabet de Baudot, tel qu'il apparaît dans les deux appareils saisis le 20 mars 1876 et le 15 juin 1877, et brevets déposés le 17 juin 1874, en en comparant les détails technique, que l'alphabet Baudot, s'il est similaire à l'alphabet de Mimault par son système binaire, pourrait être sensiblement différent. Par ailleurs, et selon la même source, ce système aurait également été présent dans le brevet Weatstone de 1858 et Highton. [22].

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

  • Transcodeur : Convertisseur de texte en code Baudot (entre autres)

Bibliographie[modifier | modifier le code]

  • (en) Eric Fischer, The Evolution of Character Codes, 1874-1968, transbay.net (lire en ligne)
  • Jacques André, Caractères, codage et normalisation – de Chappe à Unicode, vol. 6, Hermes Lavoisier,‎ 2002 (ISBN 2-7462-0594-7, lire en ligne), chap. 3-4, p. 13-49
  • (en) Baudot Character Code Reference, nemesis.lonestar.org (lire en ligne)
  • (en) B. Jack Copeland, Colossus: The Secrets of Bletchley Park's Codebreaking Computers, Oxford, Oxford University Press,‎ 2006 (ISBN 978-0-19-284055-4)

Notes et références[modifier | modifier le code]

  1. Louis Figuier, Les merveilles de la science, ou Description populaire des inventions modernes. 5-6, Suppléments. 5, Furne, Jouvet et Cie (Paris),‎ 1867-1891, 2 vol. (740, 674 p.) : fig. ; gr. in-8 (présentation en ligne, lire en ligne), chap. IV (« le télégraphe Baudot, à transmission multiple »), pages 531 à 539
  2. Algerie. Conseil supérieur de gouvernement, Procès-verbaux des délibérations - Conseil supérieur de gouvernement (Alger), [s.n.] (Alger) (ISSN 11114363, présentation en ligne)
  3. Algerie. Conseil supérieur de gouvernement, Procès-verbaux des délibérations - Conseil supérieur de gouvernement (Alger), [s.n.] (Alger) (ISSN 11114363, présentation en ligne, lire en ligne)
  4. Ordre donné par en.wikipedia.org
  5. Code de Gray
  6. Ordre donné par en.wikipedia.org
  7. dataIP Limited, « The "Baudot" Code » (consulté le 9 October 2010)
  8. http://letterfrequency.org/#morse-code-letter-frequency
  9. http://www.macfreek.nl/memory/Letter_Distribution
  10. Copeland 2006, p. 38
  11. books.google.fr/books?id=TFUiAQAAMAAJ  : donald Murray wrote:«I allocated the most frequently usedlettersin English language to the signals respresented by the fewest holes in the perforatedtape, i so on in proportion.»
  12. gallica.bnf.fr/ark:/12148/bpt6k55789563/f24.image
  13. http://paperspast.natlib.govt.nz/cgi-bin/paperspast?a=d&d=NZH19040524.2.11 PRINTING TELEGRAPH SYSTEM. New Zealand Herald, Volume XLI, Issue 12581, 24 May 1904, Page 3
  14. www.google.com/patents/US1487691
  15. Published: January 25, 1914 The New York Time http://query.nytimes.com/mem/archive-free/pdf?res=9807E3DE1E39E633A25756C2A9679C946596D6CF
  16. Description d'un système binaire de Mimault http://gallica.bnf.fr/ark:/12148/bpt6k6411532f/f254.image http://gallica.bnf.fr/ark:/12148/bpt6k6411532f/f255.image
  17. http://gallica.bnf.fr/ark:/12148/bpt6k3058f/f1262.image Description des notes contenues ans le brevet sous pli
  18. Description du cheminement entre le procès et la cours d'appel http://gallica.bnf.fr/ark:/12148/bpt6k5536373t/f12.image
  19. http://gallica.bnf.fr/ark:/12148/bpt6k55364416/f8.image
  20. http://gallica.bnf.fr/ark:/12148/bpt6k5820650f/f6.image L'écho des mines et de la métallurgie
  21. Titre : Journal des audiences de la Cour d'Amiens et des tribunaux du ressort... Auteur : France. Cour d'appel (Amiens) Éditeur : [s.n.?] (Amiens) Date d'édition : 1862 Langue : Français Droits : domaine public Identifiant : ark:/12148/cb32799222r/date Source : Bibliothèque nationale de France, département Droit, économie, politique, F-14450 Relation : http://catalogue.bnf.fr/ark:/12148/cb32799222r Provenance : bnf.fr Date de mise en ligne : 30/11/2010 Pages 211 à 229