Table des caractères Unicode/U0E80

Données clés
U+0000-0FFF	U+8000-8FFF
U+1000-1FFF	U+9000-9FFF
U+2000-2FFF	U+A000-AFFF
U+3000-3FFF	U+B000-BFFF
U+4000-4FFF	U+C000-CFFF
U+5000-5FFF	U+D000-DFFF
U+6000-6FFF	U+E000-EFFF
U+7000-7FFF	U+F000-FFFF
U+0000-0FFF	plan 0 (PMB/BMP)
U+10000-10FFF	plan 1 (PMC/SMP)
U+20000-20FFF	plan 2 (PSC/SIP)
U+30000-30FFF	plan 3 (PST/TIP)
U+40000-DFFFF	plans 4 à 13 (réservés)
U+E0000-E0FFF	plan 14 (PCS/SSP)
U+F0000-F0FFF	plan 15 (privé A)
U+100000-100FFF	plan 16 (privé B)

Table des caractères Unicode U+0E80 à U+0EFF (3 712 à 3 839 en décimal).

Lao (ou laotien) (Unicode 1.1 à 15.0)

Caractères utilisés pour l’écriture avec l’alphasyllabaire (ou abugida) lao : consonnes simples et ligatures, signes voyelles ou semi-voyelles, marques de tons, chiffres et signes de ponctuation.

Les caractères U+0EB1, U+0EB4 à U+0EB9, U+0EBB, U+0EBC et U+0EC8 à U+0ECD sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont combinés ici avec la lettre laotienne ko « ກ » (U+0E81) à des fins de lisibilité (ils sont également affichés sur un fond bleu).

Notes :

Les 5 voyelles diacritiques laotiennes dites « antéposées » U+0EC0 à U+0EC4 sont des exceptions à la règle Unicode usuelle de codage dans l’ordre logique des caractères : ces signes sont codés dans les textes avant la lettre de base, bien qu’ils se prononcent après elle (ils sont aussi écrits à gauche de cette lettre de base). Ces exceptions sont liées à la compatibilité avec des normes utilisées au Laos mais antérieures à la codification et l'unification dans Unicode/ISO/CEI 10646. On doit en tenir compte aussi dans la délimitation linguistique des grappes de graphèmes insécables. Dans la table ci-dessous, ces signes sont montrés associés avec la lettre laotienne ko « ກ » (U+0E81), codée dans l'ordre visuel (et non l'ordre logique) après chacun de ces signes (ils sont également affichés sur un fond jaune). Les autres diacritiques s'écrivent au dessus, en dessous ou à droite de la lettre de base et codés dans l'ordre logique après cette lettre.
De nombreuses polices laotiennes n'affichent pas correctement les caractères encodés depuis Unicode 12.0. Ces caractères, non nécessaires pour l'orthographe en langue lao moderne, ont un usage attestés dans des textes historiques ou la transcription de l'ancienne langue pali en Inde, encore utilisée aujourd'hui comme langue liturgique dans le bouddhisme theravāda au Laos, au Cambodge, en Thaïlande, en Birmanie et au Sri Lanka.

Table des caractères

v · d · m en fr	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0E80		ກ	ຂ		ຄ		ຆ	ງ	ຈ	ຉ	ຊ		ຌ	ຍ	ຎ	ຏ
U+0E90	ຐ	ຑ	ຒ	ຓ	ດ	ຕ	ຖ	ທ	ຘ	ນ	ບ	ປ	ຜ	ຝ	ພ	ຟ
U+0EA0	ຠ	ມ	ຢ	ຣ		ລ		ວ	ຨ	ຩ	ສ	ຫ	ຬ	ອ	ຮ	ຯ
U+0EB0	ະ	ກັ	າ	ຳ	ກິ	ກີ	ກຶ	ກື	ກຸ	ກູ	ກ຺	ກົ	ກຼ	ຽ
U+0EC0	ເກ	ແກ	ໂກ	ໃກ	ໄກ		ໆ		ກ່	ກ້	ກ໊	ກ໋	ກ໌	ກໍ	ກ໎
U+0ED0	໐	໑	໒	໓	໔	໕	໖	໗	໘	໙			ໜ	ໝ	ໞ	ໟ
U+0EE0
U+0EF0

Historique

Version initiale Unicode 1.1

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0E80		ກ	ຂ		ຄ			ງ	ຈ		ຊ			ຍ
U+0E90					ດ	ຕ	ຖ	ທ		ນ	ບ	ປ	ຜ	ຝ	ພ	ຟ
U+0EA0		ມ	ຢ	ຣ		ລ		ວ			ສ	ຫ		ອ	ຮ	ຯ
U+0EB0	ະ	ກັ	າ	ຳ	ກິ	ກີ	ກຶ	ກື	ກຸ	ກູ		ກົ	ກຼ	ຽ
U+0EC0	ເກ	ແກ	ໂກ	ໃກ	ໄກ		ໆ		ກ່	ກ້	ກ໊	ກ໋	ກ໌	ກໍ
U+0ED0	໐	໑	໒	໓	໔	໕	໖	໗	໘	໙			ໜ	ໝ
U+0EE0
U+0EF0

Compléments Unicode 6.1

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0ED0															ໞ	ໟ

Compléments Unicode 12.0

v · d · m	0	1	2	3	6	8	9	A	C	E	F
U+0E80					ຆ		ຉ		ຌ	ຎ	ຏ
U+0E90	ຐ	ຑ	ຒ	ຓ		ຘ
U+0EA0	ຠ					ຨ	ຩ		ຬ
U+0EB0								ກ຺

Compléments Unicode 15.0

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0EC0															ກ໎

Voir aussi

Liens externes

(en) [PDF] Lao, tableau sur le site Unicode.
(fr) [PDF] Lao, tableau sur le site Unicode.

Articles connexes

Blocs de caractères Unicode contenant des chiffres ou nombres[ modifier ]

Blocs de caractères Unicode contenant des signes de ponctuation[ modifier ]

Caractères ajoutés dans Unicode 1.0.0 (partiellement obsolète)^[1][ modifier ]

Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :

Commandes C0 et latin de base
Commandes C1 et latin étendu – 1
Latin étendu – A
Latin étendu – B
Latin étendu – alphabet phonétique international
Lettres modificatives avec chasse
Diacritiques
Grec et copte (codage Unicode 1.0.0 partiellement obsolète, car 13 caractères ont ensuite été supprimés ou redéfinis dans Unicode 1.1, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.0)
Cyrillique (codage Unicode 1.0.0 partiellement obsolète, car 4 caractères ont ensuite été supprimés dans Unicode 1.1), même si ces caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Arménien
Hébreu
Arabe
Dévanâgarî
Bengalî
Gourmoukhî
Goudjarati (ou gujarâtî)
Oriyâ (ou odia)
Tamoul
Télougou
Kannara (ou kannada)
Malayâlam
Thaï (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
Lao (ou laotien) (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
Tibétain (codage Unicode 1.0.0 obsolète, car tous ces caractères initialement définis de U-1000 à U-104F ont ensuite été supprimés dans Unicode 1.1 (remplacé en Unicode 3.0 par le bloc « Birman » ; les caractères tibétains ont ensuite été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0)
Géorgien – assomtavrouli et mkhédrouli
Ponctuation générale
Exposants et indices
Symboles monétaires
Signes combinatoires pour des symboles
Symboles de type lettre
Formes numérales
Flèches
Opérateurs mathématiques
Signes techniques divers (codage Unicode 1.0.0 partiellement obsolète, car 2 caractères ont ensuite été supprimés dans Unicode 1.0.1)
Pictogrammes de commande
Reconnaissance optique de caractères (OCR)
Symboles alphanumériques délimités
Filets
Pavés
Formes géométriques
Symboles divers
Casseau
Symboles et ponctuations unifiés CJC
Hiragana
Katakana
Bopomofo
Hangûl (ou hangeul) – jamos de compatibilité
Kanboun
Lettres et mois unifiés CJC délimités
Compatibilité CJC
Hangûl (ou hangeul) – syllabes coréennes (codage Unicode 1.0.0 partiellement obsolète, car tous ces caractères ont été initialement publiés sans noms standardisé qui ont ensuite été définis dans Unicode 1.1)
Zone à usage privée  (codage Unicode 1.0.0 partiellement obsolète, car le bloc initialement défini de U+E800 à U-FDFF a ensuite été réajusté de U+E000 à U-F7FF dans un erratum publié en annexe dans Unicode 1.0.1)
Formes de compatibilité unifiés CJC
Petites variantes de forme
Formes de présentation arabes – B
Formes de demi-chasse et de pleine chasse
Caractères spéciaux (codage Unicode 1.0.0 partiellement obsolète, car 1 caractère a été initialement codé dans Unicode 1.0.0 avec un nom standardisé qui a ensuite été modifié dans Unicode 1.0.1)

Caractères ajoutés ou supprimés dans Unicode 1.1 (partiellement obsolète)^[2][ modifier ]

Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :

Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
Sinogrammes unifiés CJC : 1^re partie, 2^e partie, 3^e partie, 4^e partie, 5^e partie, 6^e partie
Sinogrammes de compatibilité unifiés CJC
Formes de compatibilité unifiés CJC

Caractères ajoutés dans des blocs existants :

Caractères supprimés dans des blocs existants :

Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)

Caractères ajoutés dans Unicode 6.1^[2][ modifier ]

Nouveaux blocs ajoutés :

Nouveaux caractères dans des blocs existants :

Caractères ajoutés dans Unicode 12.0^[2][ modifier ]

Nouveaux blocs ajoutés :

Petits kana – supplément
...

Nouveaux caractères dans des blocs existants :

Caractères ajoutés dans Unicode 15.0^[2][ modifier ]

Nouveaux blocs ajoutés :

Caractères ajoutés dans des blocs existants :

Notes et références

↑ Reconstructed UnicodeData.txt (1.0.0), base de données sur le site Unicode.
↑ ^{a b c et d} DerivedAge.txt, base de données sur le site Unicode.

[unicode-data-1-0-0-1] Reconstructed UnicodeData.txt (1.0.0), base de données sur le site Unicode.

[unicode-age-2] {a b c et d} DerivedAge.txt, base de données sur le site Unicode.

[1]

[2]