Table des caractères Unicode (0000-FFFF)

Données clés
U+0000-0FFF	U+8000-8FFF
U+1000-1FFF	U+9000-9FFF
U+2000-2FFF	U+A000-AFFF
U+3000-3FFF	U+B000-BFFF
U+4000-4FFF	U+C000-CFFF
U+5000-5FFF	U+D000-DFFF
U+6000-6FFF	U+E000-EFFF
U+7000-7FFF	U+F000-FFFF
U+0000-FFFF	plan 0 (PMB/BMP)
U+10000-1FFFF	plan 1 (PMC/SMP)
U+20000-2FFFF	plan 2 (PSC/SIP)
U+30000-3FFFF	plan 3 (PST/TIP)
U+40000-DFFFF	plans 4 à 13 (réservés)
U+E0000-EFFFF	plan 14 (PCS/SSP)
U+F0000-FFFFF	plan 15 (privé A)
U+100000-10FFFF	plan 16 (privé B)

Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.

Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme "U+...." (où "...." représente un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).

Plan multilingue de base (PMB/BMP)[modifier | modifier le code]

Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.

Légende des conventions de couleurs et de style
Les blocs affichés sur fond clair sont alloués et contiennent des caractères affichables et normalisés. Certains de ces blocs peuvent également contenir des signes diacritiques.
Les blocs affichés sur fond bleu sont alloués et contiennent des signes diacritiques normalisés qui se combinent avec d’autres caractères de base après lesquels ils sont codés dans les textes.
Les blocs affichés sur fond jaune pâle sont alloués et contiennent des caractères affichables et normalisés pour des écritures de droite à gauche (ils nécessitent la prise en charge des écritures bidirectionnelles pour un rendu correct ; certains de ces caractères, mais pas tous, peuvent nécessiter une présentation en miroir selon le contexte directionnel). Certains de ces blocs peuvent également contenir des signes diacritiques.
Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non interopérables.
Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères affichables (ce sont des caractères spéciaux ou de contrôle).
Les blocs affichés sur fond gris foncé ne sont pas encore attribués officiellement (dans la version actuelle Unicode 15.0). Parmi ceux-ci : les blocs nommés « (en caractères droits entre parenthèses) » sont acceptés par les groupes de travail de normalisation Unicode et/ou ISO et en cours de validation finale pour une normalisation prochaine, cependant la liste exacte et l’ordre des caractères qui seront retenus n’est pas encore définitive, des unifications, distinctions ou ajouts étant encore possibles ; les blocs nommés « (en italique entre parenthèses) » ont seulement fait l’objet d’une proposition formelle et sont en cours de validation par les groupes de travail de normalisation Unicode et/ou ISO, pour une normalisation ultérieure, la liste précise et l’ordre des caractères n’est qu’indicative ; les blocs nommés « ¿en italique entre points d’interrogation? » sont en projet et peuvent être encore déplacés, leur taille étant seulement estimée s’ils sont finalement retenus.
Les blocs affichés sur fond noir sont pour des points de codes réservés de façon permanente à des « non-caractères ». Ils peuvent servir uniquement pour des représentations ou encodages nécessaires à des opérations ou transformations internes, propres à certains processus ou protocoles (qui les utilise avec des règles spécifiques). De tels points de codes sont interdits pour représenter un quelconque caractère dans des textes valides encodés dans une forme UTF normalisée par Unicode ou compatible. En dehors de cet usage interne pour de tels processus ou protocoles, ils ne sont pas interopérables et pas transformables librement entre toutes les formes de codage UTF normalisées. Noter qu'il existe également deux points de code réservés de façon permanente à des « non-caractères » à la fin de chacun des 17 plans dans un petit sous-bloc « spécial » affiché sur fond rouge dans les tableaux ci-dessous.
Afin de limiter la taille des pages sur Wikipédia, chaque plan Unicode est subdivisé ici en 16 plages arbitraires de 4 096 points de code chacun, décrits dans des sous-pages plus complètes accessibles par la palette de navigation en haut des pages, ou bien via les liens dans la première colonne des tables ci-dessous. Lorsqu’un bloc officiel d’Unicode s’étend sur plusieurs plages, les liens nommant les blocs dans les tables ci-dessous pointent seulement vers la première partie du bloc, et les autres parties sont liées entre elles et listées chacune dans les sous-pages des plages de 4 096 points de code.

Alphabets occidentaux modernes[modifier | modifier le code]

	+00	+20	+30	+50	+70	+80	+A0	+B0
U+0000	commandes C0	latin de base				commandes C1	latin – 1
U+0100	latin étendu – A					latin étendu – B
U+0200	latin étendu – B			alphabet phonétique international				lettres modificatives avec chasse
U+0300	diacritiques				grec et copte
U+0400	cyrillique
U+0500	cyrillique – supplément		arménien

Abjads afroasiatiques modernes (écrits de droite à gauche)[modifier | modifier le code]

	+00	+40	+50	+60	+70	+80	+90	+A0	+C0
U+0500							hébreu
U+0600	arabe
U+0700	syriaque		arabe – supplément			thâna			n’ko
U+0800	samaritain	mandéen		syriaque – supplément	arabe étendu – B			arabe étendu – A

Abugidas sud-asiatiques modernes[modifier | modifier le code]

	+00	+80
U+0900	devanâgarî	bengalî
U+0A00	gourmoukhî (ou gurmukhi)	goudjarati (ou gujarâtî)
U+0B00	oriyâ (ou odia)	tamoul
U+0C00	télougou	kannara (ou kannada)
U+0D00	malayalam	singhalais (ou cingalais)
U+0E00	thaï	lao (ou laotien)
U+0F00	tibétain
U+1000	birman

Autres alphabets et syllabaires modernes[modifier | modifier le code]

	+00	+80	+A0
U+1100			géorgien – assomtavrouli et mkhédrouli
U+1100	hangûl (ou hangeul) – jamos
U+1200	éthiopien
U+1300	éthiopien	éthiopien – supplément	chérokie
U+1400 U+1500	syllabaires autochtones canadiens
U+1600	syllabaires autochtones canadiens	ogam (ou ogham)	runes (ou futhark)

Abugidas asiatiques du sud-est modernes[modifier | modifier le code]

	+00	+10	+20	+30	+40	+50	+60	+70	+80	+90	+A0	+B0	+C0	+D0	+E0	+F0
U+1700	tagalog (ou baybayin, alibata)		hanounóo		bouhide (ou bouhid)		tagbanoua (ou tagbanwa)		khmer (ou cambodgien)

Abjad asiatique (traditionnellement écrit de haut en bas, parfois de gauche à droite)[modifier | modifier le code]

	+00	+10	+20	+30	+40	+50	+60	+70	+80	+90	+A0	+B0	+C0	+D0	+E0	+F0
U+1800	mongol (ou bitchig)

Syllabaires modernes – extension[modifier | modifier le code]

	+00	+10	+20	+30	+40	+50	+60	+70	+80	+90	+A0	+B0	+C0	+D0	+E0	+F0
U+1800												syllabaires autochtones canadiens étendus

Autres abugidas sud-asiatiques modernes et alphabets modernes – extensions[modifier | modifier le code]

	+00	+20	+50	+80	+90	+B0	+C0	+D0	+E0
U+1900	limbu		taï-le	nouveau taï-lue					khmer (ou cambodgien) – symboles
U+1A00	bougui (ou bouguinais, bugi, lontara)	taï tham (ou lanna)				diacritiques – compléments
U+1B00	balinais			soundanais			batak
U+1C00	lepcha		ol tchiki	cyrillique étendu – C	géorgien étendu – mtavrouli		soundanais	extensions védiques

Alphabets occidentaux modernes – suppléments[modifier | modifier le code]

	+00	+80	+C0
U+1D00	phonétique – supplément	phonétique étendu – supplément	diacritiques – supplément
U+1E00	latin étendu – supplément
U+1F00	grec étendu

Symboles et ponctuations d’usage général ou technique[modifier | modifier le code]

	+00	+40	+50	+60	+70	+80	+90	+A0	+C0	+D0	+F0
U+2000	ponctuation générale				exposants et indices			symboles monétaires		signes combinatoires pour symboles
U+2100	symboles de type lettre		formes numérales				flèches
U+2200	symboles mathématiques
U+2300	symboles techniques divers
U+2400	pictogrammes de commande	reconnaissance optique		alphanumériques cerclés
U+2500	filets					pavés		formes géométriques
U+2600	symboles divers
U+2700	casseau								symboles mathématiques divers – A		flèches – supplément – A
U+2800	combinaisons Braille
U+2900	flèches – supplément – B					symboles mathématiques divers – B
U+2A00	opérateurs mathématiques supplémentaires
U+2B00	symboles et flèches divers

Alphabets modernes – suppléments[modifier | modifier le code]

	+00	+30	+60	+80	+E0
U+2C00	glagolitique		latin étendu – C	copte
U+2D00	géorgien – supplément	tifinaghe		éthiopien étendu	cyrillique ét. – A
U+2E00	ponctuation complémentaire

Syllabaires, sinogrammes, clés et traits les plus courants d’Asie orientale[modifier | modifier le code]

	+00	+30	+40	+80	+90	+A0	+C0	+D0	+E0	+F0
U+2E00				sinogrammes – clés CJC – supplément
U+2F00	sinogrammes – clés chinoises du Kangxi								—	sino. – descr.
U+3000	symboles et ponct. CJC		hiragana			katakana
U+3100	bopomofo	hangûl – jamos de compatibilité			kanboun	bopomofo étendu	sinogrammes – traits CJC			katakana – supplément
U+3200	lettres et mois CJC entourés
U+3300	sinogrammes de compatibilité CJC
U+3400 ... U+4000 ...	sinogrammes unifiés CJC – supplément A
U+4D00							hexagrammes du Yi Jing
U+4E00 ... U+5000 ... U+6000 ... U+7000 ... U+8000 ... U+9000 ... U+9FFF	sinogrammes unifiés CJC
U+A000 ...	yi – syllabaire des Monts frais
U+A400					yi – clés			lissou (ou lisu, Fraser)

Alphabets, abugidas et syllabaires modernes – extensions[modifier | modifier le code]

	+00	+20	+30	+40	+60	+70	+80	+A0	+B0	+C0	+E0
U+A500	vaï
U+A600	vaï			cyrillique étendu – B				bamoun (ou bamoum, shü-mom)
U+A700	lettres modificatives de ton	latin étendu – D
U+A800	sylotî nâgrî		formes numériques communes indiennes	phags-pa			saurachtra (ou saurashtra)				dévanâgarî étendu
U+A900	kayah li		redjang (ou rejang)		jamos hangûl – A		javanais				birman étendu – B
U+AA00	cham				birman étendu – A		taï việt				meitei mayek étendu
U+AB00	éthiopien étendu – A		latin étendu – E			chérokie – supplément				meitei mayek
U+AC00 ... U+B000 ... U+C000 ... U+D000 ...	hangûl – syllabes précomposées
U+D700	syllabes hangûl précomposées								jamos hangûl étendus – B

Points de codes à usage spécial[modifier | modifier le code]

	+00	+80
U+D800 ...	demi-zone haute d’indirection
U+DB00	demi-zone haute d’indirection	demi-zone haute d’indirection à usage privé
U+DC00 ... U+DF00	demi-zone basse d’indirection
U+E000 ... U+F000 ... U+F800	zone à usage privé

Caractères de compatibilité, formes de présentation et autres caractères spéciaux[modifier | modifier le code]

	+00	+10	+20	+30	+50	+70	+D0	+F0
U+F900 U+FA00	sinogrammes de compatibilité CJC
U+FB00	formes de présentation alphabétiques				formes de présentation arabes – A
U+FC00	formes de présentation arabes – A
U+FD00	formes de présentation arabes – A						non-caractères	formes de présentation arabes – A
U+FE00	sélecteurs de variante	formes de présentation verticales	demi- diacritiques	formes de compatibilité CJC	petites formes	formes de présentation arabes – B
U+FF00	formes de demi-chasse et de pleine chasse							spéciaux

Voir aussi[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Tables de caractères classées par écriture, sur le site officiel Unicode (dernière version normalisée) :
- (fr) Tables des codes de caractères Unicode classées par écriture ;
- (en) The Unicode Character Code Charts By Script.
(en) Roadmap to the BMP (Plane 0) (écritures supportées ou en cours de normalisation), sur le site officiel Unicode.

Articles connexes[modifier | modifier le code]

v · m Unicode
Jeux de caractères de base	UCS (ISO/CEI 10646) Table des caractères Unicode ISO/CEI 646, ASCII ISO/CEI 8859-1 WGL4 Unihan
Codification de fichiers et protocoles	UTF-8 UTF-16 UTF-32 CESU-8 UTF-7 BOCU-1 SCSU BOM
Adaptations de référence	UTF-EBCDIC (Amérique, Europe occidentale) ISO/CEI 8859-11 (ou TIS-620) (Thaïlande) ISCII (Inde) SLS 1326 (ou TSCII) (Sri Lanka) Shift-JIS (Japon) GB 18030 (Chine) HKSCS (Hong Kong)
Équivalences standards	NFC (forme précomposée, recommandée) NFD (forme décomposée) NFKC (forme précomposée de compatibilité) NFKD (forme décomposée de compatibilité)
Propriétés et algorithmes	Texte bidirectionnel Casse Ordonnancement UCA
Transformations	Stringprep Punycode
Standards et normes liés	BCP 47 (étiquettes IETF d’identification de langues) ISO 639 (codes pour la représentation des noms de langues ou groupes de langues) ISO 15924 (codes pour la représentation des noms d’écritures) ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde) ISO 4217 (codes pour la représentation des noms de devises monétaires)
Mises en œuvre et applications	ICU CLDR IDN IRI Entités de caractère XLM et HTML OpenType Uniscribe Courriel et Unicode