Table des caractères Unicode/U0E00

Données clés
U+0000-0FFF	U+8000-8FFF
U+1000-1FFF	U+9000-9FFF
U+2000-2FFF	U+A000-AFFF
U+3000-3FFF	U+B000-BFFF
U+4000-4FFF	U+C000-CFFF
U+5000-5FFF	U+D000-DFFF
U+6000-6FFF	U+E000-EFFF
U+7000-7FFF	U+F000-FFFF
U+0000-0FFF	plan 0 (PMB/BMP)
U+10000-10FFF	plan 1 (PMC/SMP)
U+20000-20FFF	plan 2 (PSC/SIP)
U+30000-30FFF	plan 3 (PST/TIP)
U+40000-DFFFF	plans 4 à 13 (réservés)
U+E0000-E0FFF	plan 14 (PCS/SSP)
U+F0000-F0FFF	plan 15 (privé A)
U+100000-100FFF	plan 16 (privé B)

Table des caractères Unicode U+0E00 à U+0E7F.

Thaï

Lettres, signes voyelles ou de ton, chiffres, signes de ponctuation et symbole monétaire utilisés pour l’écriture thaïe.

Les caractères U+0E31, U+0E34 à U+0E3A, U+0E47 à U+0E4E sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont combinés ici avec la lettre thaïe ko kaï (ka) « ก » (U+0E01) à des fins de lisibilité.

Noter que les 5 voyelles antéposées suivantes :

U+0E40 (เ) LETTRE THAÏE SARA É
U+0E41 (แ) LETTRE THAÏE SARA Ë
U+0E42 (โ) LETTRE THAÏE SARA O
U+0E43 (ใ) LETTRE THAÏE SARA AÏ MAÏMOUAN
U+0E44 (ไ) LETTRE THAÏE SARA AÏ MAÏMALAÏ

sont des exceptions à la règle Unicode usuelle de codage dans l’ordre logique des caractères : ils sont codés dans les textes avant la lettre de base, bien qu’ils se prononcent après elle (ils sont aussi à gauche de cette lettre de base). Ces exceptions sont liées à la compatibilité avec des normes antérieures à Unicode. On doit en tenir compte aussi dans la délimitation linguistique des grappes de graphèmes insécables. Dans la table ci-dessous, ces caractères sont montrés associés avec la lettre thaïe ko kaï (ka) « ก » (U+0E01), codée après chacun de ces caractères.

Table des caractères

v · d · m en fr	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0E00		ก	ข	ฃ	ค	ฅ	ฆ	ง	จ	ฉ	ช	ซ	ฌ	ญ	ฎ	ฏ
U+0E10	ฐ	ฑ	ฒ	ณ	ด	ต	ถ	ท	ธ	น	บ	ป	ผ	ฝ	พ	ฟ
U+0E20	ภ	ม	ย	ร	ฤ	ล	ฦ	ว	ศ	ษ	ส	ห	ฬ	อ	ฮ	ฯ
U+0E30	ะ	กั	า	ำ	กิ	กี	กึ	กื	กุ	กู	กฺ					฿
U+0E40	เก	แก	โก	ใก	ไก	ๅ	ๆ	ก็	ก่	ก้	ก๊	ก๋	ก์	กํ	ก๎	๏
U+0E50	๐	๑	๒	๓	๔	๕	๖	๗	๘	๙	๚	๛
U+0E60
U+0E70

Voir aussi

Liens externes

(en) [PDF] Thai, tableau dans le site Unicode

Articles connexes

Blocs de caractères Unicode contenant des signes de ponctuation[ modifier ]

Blocs de caractères Unicode contenant des symboles monétaires[ modifier ]

Blocs de caractères Unicode contenant des chiffres ou nombres[ modifier ]

Caractères ajoutés ou supprimés dans Unicode 1.1 (partiellement obsolète)^[1][ modifier ]

Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :

Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
Sinogrammes unifiés CJC : 1^re partie, 2^e partie, 3^e partie, 4^e partie, 5^e partie, 6^e partie
Sinogrammes de compatibilité unifiés CJC
Formes de compatibilité unifiés CJC

Caractères ajoutés dans des blocs existants :

Caractères supprimés dans des blocs existants :

Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)

Notes et références

↑ DerivedAge.txt, base de données sur le site Unicode.

[unicode-age-1] DerivedAge.txt, base de données sur le site Unicode.

[1]