Méthodes d'encodage du chinois sur ordinateurs

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La langue chinoise utilise des sinogrammes pour son écriture. Un mot compte rarement plus de un ou deux caractères, mais il existe beaucoup plus de caractères (ou glyphes ou sinogrammes) que de touches sur un clavier d'ordinateur tel que celui généralement utilisé dans le monde. Les premiers ordinateurs chinois utilisaient pourtant des claviers de plusieurs milliers de touches.

Un clavier expérimental de sinogrammes

De nombreuses méthodes d'entrée (ou IME, Input Method Editor, en anglais) ont été conçues pour permettre au mieux l'encodage des caractères chinois par des claviers standards.

Les méthodes d'encodage des caractères chinois au clavier peuvent être classées en trois grandes familles : par encodage, par prononciation et par structure des caractères. Ci-dessous quelques exemples des méthodes développées. Pinyin complet et Pinyin double sont des variations de la méthode d'encodage pinyin. De plus, les méthodes qui demandent à l'utilisateur de choisir parmi un nombre de possibilités proposées disposent généralement de techniques avancées qui permettent d'afficher dans le menu le caractère le plus probable (contexte, fréquence, expressions).

Suivant les préférences personnelles et le type d'utilisateur, ces méthodes conviennent mieux à l'une ou l'autre personne, chaque méthode ayant par ailleurs ses qualités et ses faiblesses. Par exemple, pour une personne habituée au pinyin, la méthode pinyin peut être rapidement maîtrisée. Cependant, la vitesse d'encodage par ces méthodes est limitée, et n'est à portée que des personnes maitrisant le pinyin. La méthode Wubi demande plus d'effort pour être apprise, mais elle permet une fois pleinement maîtrisée un encodage plus rapide qu'avec les méthodes phonétiques. Pour ces raisons, il ne semble pas qu'une méthode standard d'encodage du chinois puisse être envisagée à terme.

Il existe d'autres moyens moins courants pour réaliser l'encodage de caractères chinois, dont par exemple certains utilisant un stylet et une tablette, et qui numérisent les caractères écrits par l'intermédiaire d'un logiciel de reconnaissance de l'écriture ou éventuellement des logiciels de reconnaissance du langage.

Comme pour les autres langues, dont le français, ces méthodes ne permettent l'encodage des caractères qu'en contrepartie d'un taux d'erreur relativement élevé.

Certains systèmes permettent l'encodage de caractères chinois en tapant simplement leur équivalent anglais.

Prononciation[modifier | modifier le code]

Structure du caractère[modifier | modifier le code]

Combinaison de prononciation et de la structure du caractère[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Méthodes d'encodage du shanghaïen sur ordinateurs, téléchargement gartuit
  2. Méthodes d'encodage du shanghaïen sur ordinateurs téléchargement gartuit

Liens internes[modifier | modifier le code]

Codage de caractères[modifier | modifier le code]

Article principal : Codage des caractères chinois

Liens externes[modifier | modifier le code]