Table des caractères Unicode/U0E00
Table des caractères Unicode U+0E00 à U+0E7F.
Thaï
Lettres, signes voyelles ou de ton, chiffres, signes de ponctuation et symbole monétaire utilisés pour l’écriture thaïe.
Les caractères U+0E31, U+0E34 à U+0E3A, U+0E47 à U+0E4E sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont combinés ici avec la lettre thaïe ko kaï (ka) « ก » (U+0E01) à des fins de lisibilité.
Noter que les 5 voyelles antéposées suivantes :
- U+0E40 (เ) LETTRE THAÏE SARA É
- U+0E41 (แ) LETTRE THAÏE SARA Ë
- U+0E42 (โ) LETTRE THAÏE SARA O
- U+0E43 (ใ) LETTRE THAÏE SARA AÏ MAÏMOUAN
- U+0E44 (ไ) LETTRE THAÏE SARA AÏ MAÏMALAÏ
sont des exceptions à la règle Unicode usuelle de codage dans l’ordre logique des caractères : ils sont codés dans les textes avant la lettre de base, bien qu’ils se prononcent après elle (ils sont aussi à gauche de cette lettre de base). Ces exceptions sont liées à la compatibilité avec des normes antérieures à Unicode. On doit en tenir compte aussi dans la délimitation linguistique des grappes de graphèmes insécables. Dans la table ci-dessous, ces caractères sont montrés associés avec la lettre thaïe ko kaï (ka) « ก » (U+0E01), codée après chacun de ces caractères.
Table des caractères
en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0E00 | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
U+0E10 | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
U+0E20 | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
U+0E30 | ะ | กั | า | ำ | กิ | กี | กึ | กื | กุ | กู | กฺ | ฿ | ||||
U+0E40 | เก | แก | โก | ใก | ไก | ๅ | ๆ | ก็ | ก่ | ก้ | ก๊ | ก๋ | ก์ | กํ | ก๎ | ๏ |
U+0E50 | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ||||
U+0E60 | ||||||||||||||||
U+0E70 |
Voir aussi
Liens externes
- (en) [PDF] Thai, tableau dans le site Unicode
Articles connexes
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Télougou
- Singhalais
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Hanounóo
- Khmer
- Mongol (ou bitchig)
- Limbou
- Bougui (ou bouguinais, bugi, lontara)
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation – supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou (ou lisu, Fraser)
- Vaï
- Cyrillique étendu – B
- Bamoun (ou bamoum, shü-mom)
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Ougaritique
- Cunéiforme persépolitain (vieux perse)
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Yézidi
- Brâhmî
- Kaïthî (ou kayathi)
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Multanais (ou multanî)
- Dévanagari étendu – A
- Cunéiforme – nombres et ponctuation
- Mrou
- Vah bassa
- Adlam
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- Arabe étendu – B
- Bengalî
- Goudjarâtî
- Tamoul
- Thaï
- Khmer (ou cambodgien)
- Symboles monétaires
- Formes numérales communes indiennes
- Arabe – formes de présentation – A (3e partie)
- Petites variantes de forme
- Formes de demi et pleine chasse
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Singhalais – nombres archaïques
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Adlam
- Alphanumériques délimités – supplément
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Notes et références
- DerivedAge.txt, base de données sur le site Unicode.