Code Baudot

Un article de Wikipédia, l'encyclopédie libre.
Bande de papier avec des trous représentant des caractères du « code Baudot ».
Le clavier et ses cinq touches.

Le code Baudot est dans l'histoire un des premiers codages des caractères binaires. Il est plus ancien que le code ASCII par exemple. Il est aussi appelé code télégraphique Alphabet International (AI) no 1 ou Alphabet International (AI) no 2 ou code CCITT no 2.

C'est un code binaire : chaque caractère est codé par une série de 5 bits (0 ou 1), ce qui permet 25 = 32 combinaisons. Ces 32 caractères ne suffisent pas pour coder les lettres (26), les chiffres (10), les signes opératoires (+-/x=), la ponctuation (, ;.:!?), et les autres symboles (&, #..) ; le code Baudot utilise donc deux jeux de caractères appelés Lettres (Lower Case) et Chiffres (Upper Case). Le jeu de caractères Chiffre comprend les signes opératoires et de ponctuation et les autres symboles. Deux caractères, Inversion Lettres et Inversion Chiffres (code 31 et 27), permettent le passage d'un jeu de caractères à l'autre.

Il s'agit donc du premier codage des caractères mécanisé.

Évidemment, l’inconvénient réside dans des commutations fréquentes. D’autre part, ce code, bien qu’il soit plus riche que le code Morse international, ne traite pas les minuscules et certains symboles.

Historique[modifier | modifier le code]

Le premier code Baudot a été développé par Émile Baudot en 1874 pour les lignes de télégraphie électrique : il s'agit de l'Alphabet international no 1.

Les caractères étaient composés à l'aide d'un clavier à cinq touches, où chaque touche correspondait à l'un des cinq bits de chaque caractère.

En 1877, l'installation quintuple permet cinq fonctionnements simultanés et donc un débit cinq fois plus grand[sv1919 1].

Différents arrangements ont ensuite été normalisés et adoptés pour les communications internationales, comme l'alphabet international no 1 et l'alphabet international no 2.

La technologie du ruban perforé est abandonnée avec le Télex, un réseau de communication entre téléscripteurs, mis en place à partir des années 1930 et encore en service au début du XXIe siècle, bien que massivement remplacé par d'autres technologies.

La notion de codage des caractères était née. Différentes évolutions techniques ont permis d'augmenter le nombre de caractères représentables en passant de cinq à six (six bits), puis sept et huit bits (octet), pour représenter respectivement 32, 64, 128 et 256 symboles.

Le principe de codage des caractères par un système binaire abstrait de taille fixe est toujours utilisé de nos jours dans les systèmes de télécommunications bien que le nombre de caractères et leur système de représentation ait considérablement évolué.

Objectif[modifier | modifier le code]

Cet appareil a permis de composer des dépêches.

L'utilisation du multiplexage a permis d'atteindre 3 000 mots par heure en duplex contre 1 000 mots par heure en morse duplex.

Ce chiffre s'obtient en comptant 25 mots pour 165 lettres. Cette vitesse était obtenue grâce à une roue qui permettait de multiplexer plusieurs communications (de l'ordre de quatre ou six simultanées).

Le dispositif était basé sur un clavier à cinq touches pouvant être pressées simultanément et qui chacune pouvait produire un courant positif ou négatif (voir bit). Cette information binaire est représentée ci-dessous par pour l'absence de perforation, ou par pour une perforation, enchaînées par séquence de 5.

Ce code de 32 valeurs était composé de 2 plages de 28 caractères imprimables et de quatre codes de contrôle.

Les quatre codes de contrôle permettaient[1] :

  • ⬜⬜⬜⬜⬜ de gérer une espace ou un état de repos (NULL) ;
  • ⬜⬜⬜⬜⬛ de basculer au mode lettres (LTRS) ;
  • ⬜⬜⬜⬛⬜ de basculer au mode figures (FIGS) pour les chiffres, ponctuations et symboles ;
  • ⬜⬜⬜⬛⬛ d'indiquer une erreur de composition du caractère précédemment transmis (DEL).


Évolution[modifier | modifier le code]

Les codes initiaux ont été le code Baudot et l'alphabet n°1.

Vers 1901, l'inventeur Donald Murray (en) modifie le code Baudot original en réorganisant les caractères, ajoute de nouveaux symboles parmi les 32 possibles , et introduit les jeux de caractères[réf. souhaitée]. Comme il souhaitait utiliser un clavier de machine à écrire, il n'y avait plus de correspondance physique entre le code et la disposition des touches. Il organisa donc les caractères pour que les caractères les plus courants génèrent un nombre minimal de perforations parmi les cinq possibles, ce qui minimise l'usure du matériel.

En 1911, aux États-Unis, la machine Morkrum est munie d'un clavier de machine à écrire d'un code à cinq perforations et d'un imprimeur, capable d'annuler un caractère en poinçonnant les cinq trous, le tout fonctionnant à une vitesse de 360 lettres à la minute ou six lettres à la seconde. La transmission quadruplex permet d'augmenter le débit en faisant passer deux émissions et deux réceptions sur un même fil[sv1919 1].

La Western Union modifia le code de Murray, en éliminant certains caractères. Le code obtenu est le code actuel — parfois dit Baudot —. On présente plus bas le code US TTY, très proche du code CCITT.

En 1917, la Western Electric est dotée d'un système simplex contenant en plus des cinq informations du code, une information de start et une information du stop permettant de démarrer et d'arrêter la transmission des cinq bits à l'aide de deux électro-aimants, pour les lignes de grande longueur[2].

En 1917, la réception dispose également d'une touche LF (line feed) et d'une touche CR (carriage return)[3].

En 1921, aux États-Unis, trois systèmes basés sur une transmission start-stop ont atteint le succès commercial. Il s'agit notamment du système Morkrum et du système Western Union[4].

Lors de la standardisation de ce code à un niveau international, le code US TTY a été modifié pour donner le code CCITT no 2. Il en diffère par une inversion (BEL et ') et des définitions additionnelles dans les FIGS (#, & et !), laissées volontairement non définies par le CCITT no 2 pour permettre des usages nationaux/locaux.

En hommage à Émile Baudot, une partie de son nom désigne l'unité de mesure du débit de signal, le Baud (symbole Bd).

Utilisation et application[modifier | modifier le code]

En , après avoir expérimenté avec succès l'appareil entre Marseille et Alger, on décide de développer l'usage de l'appareil Baudot sur les câbles sous-marins d'Algérie[5].

L'appareil Baudot peut être utilisé avec deux fils : un fil sert alors à la transmission, et l'autre à la réception[5]. Le code Baudot est utilisé dans le réseau Télex. Il est également mis en œuvre dans certaines versions du radiotélétype.

Le principe de perforation sur un nombre fixe de bits a été repris, en changeant à la fois le système de codage et le format du support, dans le système des cartes perforées. Il a également inspiré le Manchester Mark I.

Variations et standardisations[modifier | modifier le code]

Le principe du code Baudot basé sur cinq bits, avec deux contextes (lettres et chiffres) a continué à être utilisé avec certaines variations. Pour une bonne compréhension entre des parties différentes, une standardisation a dû s'imposer.

Le principe du code Baudot est repris à un niveau dans les Alphabets internationaux no 1 et no 2.

À un niveau local, on le retrouve dans le Code US TTY.

Code original et Alphabet international no 1[modifier | modifier le code]

Code continental et britanniques[modifier | modifier le code]

Le code Baudot se compose de 31 symboles et d'un code de changement de jeu de caractères.

Les lettres sont codées en classant les voyelles et les consonnes séparément dans l'ordre alphabétique et en suivant l'ordre du code de Gray, trois quarts de siècle avant que celui-ci ne soit breveté aux États-Unis.

Aucun lien apparent ne semble unir le codage des lettres et le codage des chiffres.

Les cinq premiers chiffres sont codés sur trois bits dans un ordre d'origine méconnue. Les cinq chiffres suivants sont codés dans le même ordre, mais avec le bit no 4 positionné.

Le code de la British Post Office est détaillé dans la table dénommée "Code Baudot (Arrangement européen et britannique)".

Alphabet international no 1[modifier | modifier le code]

L'alphabet n°1 est un accord international qui réserve certains caractères à un usage local.

Code de Murray[modifier | modifier le code]

L'alphabet international no 2 est incompatible avec l'Alphabet international no 1 (Code Baudot original).

La logique des lettres de l'Alphabet international no 2 n'est pas apparente au premier abord. Un seul bit est positionné (perforé) pour E et T, dix autres lettres AOINSHRDLU ne sont représentées qu'avec deux bits positionnés. Cette disposition "ET AOINSHRDLU" est donc dans un ordre ressemblant fortement à la séquence ETAOIN SHRDLU déjà connue à l'époque[8].

Il faut donc comprendre que les combinaisons nécessitant le moins de perforations sont associées aux caractères les plus fréquents[11],[8].

Chaque lettre prenait un demi-pouce sur les bandes perforées[12][source insuffisante].

Le télégraphe de Murray a été en compétition avec nombre d'autres systèmes. Mais il permet d'effacer un caractère sans que cela n'apparaisse dans le message final, pour plaire aux businessmen. Il a été essayé par les administrations allemandes et britanniques (y compris en Inde), notamment sur le câble Londres-Edinbourg durant quinze mois, mais aussi sur le câble Emden-Londres. Le jeu complet d'appareil coûte alors 1 400 livres britanniques. Le jeu complet d'appareil coûte entre 700 et 800 livres britanniques. À titre de comparaison le clavier Morse ne coûte que dix livres environ. Ce système a été développé en partie à Sydney, New-York, Londres et Berlin. Le système a notamment intéressé l'ingénieur Kraatz et le Kolnische Zeitung. Le système permettait également d'écrire en forme de page à un rythme de 120 mots par minute, dans un sens (donc 240 mots en cas de transmission dans les deux sens (duplex)), sur une distance d'un millier de miles britanniques[13].

Murray a également déposé un brevet sur la synchronisation automatique permettant de perfectionner les systèmes Baudot et Picard[14].

Le code Baudot a été utilisé en France, dans les capitales européennes majeures ainsi que dans différents pays notamment la Russie, l'Inde et le Brésil. En France, avec le système Baudot plusieurs villes peuvent être branchées sur une seule ligne (un seul câble). De plus, une des avancées majeures de Murray est le fait de perforer le message reçu, ce qui permet de le retransmettre automatiquement et sans erreur, vers plusieurs destinations. Dès 1914, la Western Union dispose d'un lien entre Boston et New-York, ce qui lui permet d'échanger 3 000 messages par jour. Entre Londres et Birmingham, 5 000 messages par jour sont échangés[15]. Ceci contribue à un effet de réseau.

L'Alphabet international no 2 associe les chiffres et les lettres de la même manière que le clavier Qwerty de machine à écrire.

L'Alphabet international no 2 finira par être remplacé par l'Alphabet international no 5, utilisant sept bits au lieu de cinq.

Code US TTY et Alphabet international no 2[modifier | modifier le code]

Code US TTY.

Code US TTY[modifier | modifier le code]

Le code US TTY est une adaptation régionale aux États-Unis. Il se distingue par la présences des caractères Livre (£), Dollar ($), Bel (Sonnerie), CR et LF, pour prendre en charge les deux éléments d'un retour à la ligne.

Comme le code de Murray, il correspond à une disposition de clavier QWERTY, en suivant l'ordre des chiffres 123456.

Alphabet international no 2[modifier | modifier le code]

Comme indiqué dans l'article anglophone, l'alphabet international no 2 dispose de plusieurs variantes.

En particulier, quatre caractères sont déjà réservés aux services intérieurs de chaque administration dès 1934; il s'agit des caractères associés aux lettres D, F, G, H [16] (de code 09, 0D, 14 et 1A).

Les deux tables ci-dessous reproduisent la partie chiffre de la variante alphabet Alphabet international no 2 et la variante américaine.

Sont colorés les caractères différent de l'un à l'autre.

Variante ITA2 du code Baudot–Murray (jeu de chiffres, avec caractère d'échappement en code 0x1B)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
 
0_
 
NUL 3 LF SP ' 8 7 CR ENQ 4 BEL , ! : (
 
1_
 
5 + ) 2 £ 6 0 1 9 ? & SO ou FIGS . / = LTRS
Variante US-TTY du code Baudot–Murray (du code Baudot–Murray (jeu de chiffres, avec caractère d'échappement en code 0x1B)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
 
0_
 
NUL 3 LF SP BEL 8 7 CR $ 4 ' , ! : (
 
1_
 
5 " ) 2 # 6 0 1 9 ? & SO ou FIGS . / ; LTRS

Légende :

  • Alphabétique
  • Caractère de contrôle
  • Chiffre
  • Ponctuation
  • Ponctuation étendue
  • Charactère graphique
  • International
  • Non défini

Variante cyrillique[modifier | modifier le code]

La correspondance cyrillique (russe) aux caractères latins est fournie par le système de codage MTK-2.

Histoire[modifier | modifier le code]

Différentes techniques ont été mises en œuvre pour accélérer la rapidité de transmission sans être en attente de l'opérateur télégraphique, dès le développement du Code Baudot.

Liaison série[modifier | modifier le code]

Les bits de mise en marche (start) et d'arrêt (stop) ont été introduits en Amérique en 1907 par Charles L Krumm et son fils H Krumm. Il a été fabriqué par Morkrum company devenu Teletype corporation, et trouve son application pratique vers 1920[17].

Ceci réduit la sensibilité de l’émetteur et du récepteur à la synchronisation de la rotation, et permet donc des vitesses plus rapides en bénéficiant d'une resynchronisation automatique[17].

Liaison série néerlandaise[modifier | modifier le code]

W I K I
0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 1 0 1 1 1 1 0 0 0 1 0 0 1 1 0 0
  • Inactif
  • Startbit
  • Stopbit
  • Liaison série Madrid - ITA 2[modifier | modifier le code]

    Des sources indiquent le fonctionnement en circuit fermé et en circuit doublé, mais n'indiquent pas l'état de repos[16],[17].

    Donnée W I K I
    Codage x x x x x 0 1 1 0 0 1 1 x x x 0 0 1 1 0 0 1 0 1 1 1 1 0 1 x x 0 0 1 1 0 0 1
    Décodage repos M 1 1 0 0 1 A repos M 0 1 1 0 0 A M 1 1 1 1 0 A repos M 0 1 1 0 0 A
    Reçu W I K I
    Légende Madrid[16]
    Symbole Circuit fermé [16] Courant double [16] M/A Début/fin
    0 Pas de courant [17] Courant négatif [17] M Mise en marche[16], dit bit de start, de l'anglais[17]
    1 Courant positif Courant positif[17] 1 Arrêt[16], dit bit de stop, également de l'anglais[17]
    x Non précisé par la source[16]

    Controverse avec l'invention de Monsieur Mimault de Poitiers[modifier | modifier le code]

    Une invention similaire a été développée et brevetée par M. Mimault de Poitiers.

    Mimault avait inventé plusieurs alphabets, dont un basé sur le système binaire[18].

    Le procès concernait notamment l'alphabet.

    Mimault avait notamment déposé le brevet 1301 déposé le  :

    • systèmes télégraphiques multiples, imprimeurs et écrivants basés sur des combinaisons mécaniques ou graphiques provenant de « (X+1) puissance m »
    • systèmes télégraphiques multiples, imprimeurs et écrivants basés sur des combinaisons de la progression 1 : 2 : 4 : 8 : 16[19].

    La justice a considéré que le codage de Baudot était de même nature que celui de Mimault :

    Le , la cour de cassation s'est prononcée sur le procès opposant « M » à « B ». « M » employé à l'administration des postes et des télégraphes. M a étudié les « effets électriques, variant de l'unité à 31, nécessaires à la transmission des 31 signes, lettres ou caractères indispensables pour la composition de la langue électrique. » La solution de M utilisait 8 fils conducteurs, pour suivre la progression géométrique 1, 2, 4, 8, 16. « B » est employé de la même administration, et a construit « un télégraphe imprimeur présentant les mêmes propriétés », « qui se traduisait automatiquement par un appareil construit suivant la même progression géométrique ».

    Après l’utilisation (monopole) de l'appareil de monsieur « B » par l'administration dès postes, « le sieur M… intenta contre le sieur B… une instance en contrefaçon qui fut favorablement accueillie par le Tribunal de la Seine ».

    En date du , par arrêt La Cour de Paris s'est prononcée sur appel. Elle a estimé que « le moyen de M », isolé de tout organe mécanique, était impuissant à produire quoi que ce soit et constituait « un principe abstrait et une loi purement théorique non brevetable ». Elle a en conséquence infirmé la décision des premiers juges et déclaré qu'il n'y avait pas de la part du sieur B… contrefaçon de l'appareil M…

    La Cour de cassation, saisie d'un pourvoi, s'est appuyée, d'abord, sur les constatations de l'arrêt attaqué, d'où il résulte : 1° que B… a pris pour point de départ de son système une partie au moins de celui de M… et notamment l'application de la loi de progression géométrique 1, 2, 4, 8, 16 ; 2° que la disposition de son combinateur est faite en vue de cette progression et qu'il obtient 31 signaux au moyen de la même progression mécaniquement appliquée ; 3° que par là, l'appareil B… participe à certaines propriétés de l'appareil M…, qu'il existe en conséquence entre ces appareils certaines ressemblances au double point de vue du nombre des effets élémentaires à combiner et du résultat en vertu duquel on les combine.

    La Cour suprême a conclu, de ces différentes constatations, que le brevet de M…, ayant pour objet une application nouvelle, soit de moyens, soit de principes connus, avait été valablement pris ; elle a jugé, par suite, que la loi du se trouvait violée, et elle a cassé l'arrêt de la Cour de Paris, avec renvoi devant la Cour d'appel d'Amiens[20].

    Toutefois, la cour d'Amiens a abondé dans le sens de la cour de la Seine[21].

    Le dernier pourvoi de Louis-Victor Mimault contre l'arrêt de la cour d'appel d'Amiens a été rejeté par la cour de cassation au profit d’Émile Baudot employé et de Dumoulin-Froment, constructeur[22].

    Toutefois, le journal de la cour d'appel d'Amiens laisse comprendre que l'alphabet de Baudot, tel qu'il apparaît dans les deux appareils saisis le et le , et les brevets déposés le , en comparant les détails techniques, que l'alphabet Baudot, s'il est similaire à l'alphabet de Mimault par son système binaire, pourrait être sensiblement différent. Par ailleurs, et selon la même source, ce système aurait également été présent dans les brevets Wheatstone de 1858 et Highton (en)[23].

    Voir aussi[modifier | modifier le code]

    Articles connexes[modifier | modifier le code]

    Liens externes[modifier | modifier le code]

    • (en) Cryptii : Simulation du code Baudot avec ruban perforé
    • (en) Transcodeur : Convertisseur de texte en code Baudot (entre autres)

    Bibliographie[modifier | modifier le code]

    1. a et b p. 32

    Notes et références[modifier | modifier le code]

    1. Louis Figuier, Les merveilles de la science, ou Description populaire des inventions modernes. 5-6, Suppléments. 5, Furne, Jouvet et Cie (Paris), 1867-1891, 2 vol. (740, 674 p.) : fig. ; gr. in-8 (BNF 34345167, lire en ligne), chap. IV (« le télégraphe Baudot, à transmission multiple »), p. 531 à 539.
    2. « Annales des postes, télégraphes et téléphones : recueil de documents français et étrangers concernant les services techniques et l'exploitation des postes, télégraphes et téléphones » Accès libre, sur Gallica, (consulté le ).
    3. « Annales des postes, télégraphes et téléphones : recueil de documents français et étrangers concernant les services techniques et l'exploitation des postes, télégraphes et téléphones » Accès libre, sur Gallica, (consulté le ).
    4. « Revue générale de l'électricité : organe de l'Union des syndicats de l'électricité », sur Gallica, (consulté le ).
    5. a et b Algérie. Conseil supérieur de gouvernement, Procès-verbaux des délibérations : Conseil supérieur de gouvernement (Alger), s.n. (Alger), 1899-1900 (ISSN 1111-4363, BNF 32783201, lire en ligne).
    6. Code de Gray
    7. (en) dataIP Limited, « The "Baudot" Code », sur dataip.co.uk (consulté le ).
    8. a b et c (en) Telegraph and Telephone Age, , 624 p. (lire en ligne).
      : Donald Murray wrote: « I allocated the most frequently used letters in English language to the signals respresented by the fewest holes in the perforated tape, i so on in proportion. »
    9. (en)[1].
    10. [2].
    11. Copeland 2006, p. 38.
    12. [3].
    13. PRINTING TELEGRAPH SYSTEM. New Zealand Herald, Volume XLI, Issue 12581, 24 May 1904, Page 3.
    14. (en) Brevet U.S. 1487691.
    15. (en) Published: January 25, 1914 The New York Time [PDF].
    16. a b c d e f g et h « Convention internationale des télécommunications règlement télégraphique et règlement téléphonique annexés à la convention internationale des télécommunications, Madrid, 1932Ministère des postes, télégraphes et téléphones » Accès libre, sur Gallica, (consulté le ).
    17. a b c d e f g et h « NADCOMM Museum », sur web.archive.org (consulté le ).
    18. Description d'un système binaire de Mimault https://gallica.bnf.fr/ark:/12148/bpt6k6411532f/f254.image https://gallica.bnf.fr/ark:/12148/bpt6k6411532f/f255.image
    19. Description des notes contenues ans le brevet sous pli gallica.bnf.fr.
    20. Description du cheminement entre le procès et la cour d'appel https://gallica.bnf.fr/ark:/12148/bpt6k5536373t/f12.image
    21. « Portefeuille économique des machines, de l'outillage et du matériel » Accès libre, sur Gallica, (consulté le ).
    22. L'écho des mines et de la métallurgie.
    23. France. Cour d'appel (Amiens), Journal des audiences de la Cour d'Amiens et des tribunaux du ressort..., s.n.? (Amiens), (BNF 32799222, lire en ligne), p. 211 à 229.