Table des caractères Unicode/U0E80
Table des caractères Unicode U+0E80 à U+0EFF (3 712 à 3 839 en décimal).
Lao (ou laotien) (Unicode 1.1 à 15.0)
[modifier | modifier le code]Caractères utilisés pour l’écriture avec l’alphasyllabaire (ou abugida) lao : consonnes simples et ligatures, signes voyelles ou semi-voyelles, marques de tons, chiffres et signes de ponctuation.
Les caractères U+0EB1, U+0EB4 à U+0EB9, U+0EBB, U+0EBC et U+0EC8 à U+0ECD sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont combinés ici avec la lettre laotienne ko « ກ » (U+0E81) à des fins de lisibilité (ils sont également affichés sur un fond bleu).
Notes :
- Les 5 voyelles diacritiques laotiennes dites « antéposées » U+0EC0 à U+0EC4 sont des exceptions à la règle Unicode usuelle de codage dans l’ordre logique des caractères : ces signes sont codés dans les textes avant la lettre de base, bien qu’ils se prononcent après elle (ils sont aussi écrits à gauche de cette lettre de base). Ces exceptions sont liées à la compatibilité avec des normes utilisées au Laos mais antérieures à la codification et l'unification dans Unicode/ISO/CEI 10646. On doit en tenir compte aussi dans la délimitation linguistique des grappes de graphèmes insécables. Dans la table ci-dessous, ces signes sont montrés associés avec la lettre laotienne ko « ກ » (U+0E81), codée dans l'ordre visuel (et non l'ordre logique) après chacun de ces signes (ils sont également affichés sur un fond jaune). Les autres diacritiques s'écrivent au dessus, en dessous ou à droite de la lettre de base et codés dans l'ordre logique après cette lettre.
- De nombreuses polices laotiennes n'affichent pas correctement les caractères encodés depuis Unicode 12.0. Ces caractères, non nécessaires pour l'orthographe en langue lao moderne, ont un usage attestés dans des textes historiques ou la transcription de l'ancienne langue pali en Inde, encore utilisée aujourd'hui comme langue liturgique dans le bouddhisme theravāda au Laos, au Cambodge, en Thaïlande, en Birmanie et au Sri Lanka.
Table des caractères
[modifier | modifier le code] en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0E80 | ກ | ຂ | ຄ | ຆ | ງ | ຈ | ຉ | ຊ | ຌ | ຍ | ຎ | ຏ | ||||
U+0E90 | ຐ | ຑ | ຒ | ຓ | ດ | ຕ | ຖ | ທ | ຘ | ນ | ບ | ປ | ຜ | ຝ | ພ | ຟ |
U+0EA0 | ຠ | ມ | ຢ | ຣ | ລ | ວ | ຨ | ຩ | ສ | ຫ | ຬ | ອ | ຮ | ຯ | ||
U+0EB0 | ະ | ກັ | າ | ຳ | ກິ | ກີ | ກຶ | ກື | ກຸ | ກູ | ກ຺ | ກົ | ກຼ | ຽ | ||
U+0EC0 | ເກ | ແກ | ໂກ | ໃກ | ໄກ | ໆ | ກ່ | ກ້ | ກ໊ | ກ໋ | ກ໌ | ກໍ | ກ໎ | |||
U+0ED0 | ໐ | ໑ | ໒ | ໓ | ໔ | ໕ | ໖ | ໗ | ໘ | ໙ | ໜ | ໝ | ໞ | ໟ | ||
U+0EE0 | ||||||||||||||||
U+0EF0 |
Historique
[modifier | modifier le code]Version initiale Unicode 1.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0E80 | ກ | ຂ | ຄ | ງ | ຈ | ຊ | ຍ | |||||||||
U+0E90 | ດ | ຕ | ຖ | ທ | ນ | ບ | ປ | ຜ | ຝ | ພ | ຟ | |||||
U+0EA0 | ມ | ຢ | ຣ | ລ | ວ | ສ | ຫ | ອ | ຮ | ຯ | ||||||
U+0EB0 | ະ | ກັ | າ | ຳ | ກິ | ກີ | ກຶ | ກື | ກຸ | ກູ | ກົ | ກຼ | ຽ | |||
U+0EC0 | ເກ | ແກ | ໂກ | ໃກ | ໄກ | ໆ | ກ່ | ກ້ | ກ໊ | ກ໋ | ກ໌ | ກໍ | ||||
U+0ED0 | ໐ | ໑ | ໒ | ໓ | ໔ | ໕ | ໖ | ໗ | ໘ | ໙ | ໜ | ໝ | ||||
U+0EE0 | ||||||||||||||||
U+0EF0 |
Compléments Unicode 6.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0ED0 | ໞ | ໟ |
Compléments Unicode 12.0
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0E80 | ຆ | ຉ | ຌ | ຎ | ຏ | |||||||||||
U+0E90 | ຐ | ຑ | ຒ | ຓ | ຘ | |||||||||||
U+0EA0 | ຠ | ຨ | ຩ | ຬ | ||||||||||||
U+0EB0 | ກ຺ |
Compléments Unicode 15.0
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0EC0 | ກ໎ |
Voir aussi
[modifier | modifier le code]Liens externes
[modifier | modifier le code]Articles connexes
[modifier | modifier le code]- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Singhalais – nombres archaïques
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Adlam
- Alphanumériques délimités – supplément
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Télougou
- Singhalais
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Hanounóo
- Khmer
- Mongol (ou bitchig)
- Limbou
- Bougui (ou bouguinais, bugi, lontara)
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation – supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou (ou lisu, Fraser)
- Vaï
- Cyrillique étendu – B
- Bamoun (ou bamoum, shü-mom)
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Ougaritique
- Cunéiforme persépolitain (vieux perse)
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Yézidi
- Brâhmî
- Kaïthî (ou kayathi)
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Multanais (ou multanî)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Siddham
- Dévanagari étendu – A
- Cunéiforme – nombres et ponctuation
- Mrou
- Vah bassa
- Adlam
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte (codage Unicode 1.0.0 partiellement obsolète, car 13 caractères ont ensuite été supprimés ou redéfinis dans Unicode 1.1, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.0)
- Cyrillique (codage Unicode 1.0.0 partiellement obsolète, car 4 caractères ont ensuite été supprimés dans Unicode 1.1), même si ces caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
- Lao (ou laotien) (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
- Tibétain (codage Unicode 1.0.0 obsolète, car tous ces caractères initialement définis de U-1000 à U-104F ont ensuite été supprimés dans Unicode 1.1 (remplacé en Unicode 3.0 par le bloc « Birman » ; les caractères tibétains ont ensuite été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0)
- Géorgien – assomtavrouli et mkhédrouli
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Signes combinatoires pour des symboles
- Symboles de type lettre
- Formes numérales
- Flèches
- Opérateurs mathématiques
- Signes techniques divers (codage Unicode 1.0.0 partiellement obsolète, car 2 caractères ont ensuite été supprimés dans Unicode 1.0.1)
- Pictogrammes de commande
- Reconnaissance optique de caractères (OCR)
- Symboles alphanumériques délimités
- Filets
- Pavés
- Formes géométriques
- Symboles divers
- Casseau
- Symboles et ponctuations unifiés CJC
- Hiragana
- Katakana
- Bopomofo
- Hangûl (ou hangeul) – jamos de compatibilité
- Kanboun
- Lettres et mois unifiés CJC délimités
- Compatibilité CJC
- Hangûl (ou hangeul) – syllabes coréennes (codage Unicode 1.0.0 partiellement obsolète, car tous ces caractères ont été initialement publiés sans noms standardisé qui ont ensuite été définis dans Unicode 1.1)
- Zone à usage privée (codage Unicode 1.0.0 partiellement obsolète, car le bloc initialement défini de U+E800 à U-FDFF a ensuite été réajusté de U+E000 à U-F7FF dans un erratum publié en annexe dans Unicode 1.0.1)
- Formes de compatibilité unifiés CJC
- Petites variantes de forme
- Formes de présentation arabes – B
- Formes de demi-chasse et de pleine chasse
- Caractères spéciaux (codage Unicode 1.0.0 partiellement obsolète, car 1 caractère a été initialement codé dans Unicode 1.0.0 avec un nom standardisé qui a ensuite été modifié dans Unicode 1.0.1)
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Nouveaux blocs ajoutés :
- Arabe étendu – A
- Soundanais – supplément
- Meitei mayek – extensions
- Méroïtique – hiéroglyphes
- Méroïtique – cursif
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Tâkrî
- Miao (ou Pollard)
- Arabe – symboles mathématiques alphabétiques
Nouveaux caractères dans des blocs existants :
- Arménien
- Arabe
- Goudjarati (ou gujarâtî)
- Lao (ou laotien)
- Géorgien – assomtavrouli et mkhédrouli
- Soundanais
- Extensions védiques
- Symboles mathématiques divers – A
- Copte
- Géorgien – supplément (nouskhouri)
- Tifinagh
- Ponctuation – supplément
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Cyrillique étendu – B
- Latin étendu – D
- Sinogrammes de compatibilité CJC
- Alphanumériques entourés – supplément
- Symboles et pictogrammes divers
- Émoticônes
Nouveaux blocs ajoutés :
Nouveaux caractères dans des blocs existants :
Nouveaux blocs ajoutés :
- Arabe étendu – C
- Dévanagari étendu – A
- Kawi
- Numéraux kaktoviks
- Cyrillique étendu – D
- Nag mundari
- Sinogrammes unifiés CJC – supplément H
Caractères ajoutés dans des blocs existants :
- Kannara (ou kannada)
- Lao (ou laotien)
- Khojkî
- Hiéroglyphes égyptiens
- Kana – supplément
- Petits kana – supplément
- Latin étendu – G
- Symboles cartographiques ou liés au transport
- Symboles alchimiques
- Formes géométriques – supplément
- Symboles et pictogrammes – supplément A
- Sinogrammes unifiés CJC – supplément C
Notes et références
[modifier | modifier le code]- Reconstructed UnicodeData.txt (1.0.0), base de données sur le site Unicode.
- DerivedAge.txt, base de données sur le site Unicode.