Wikipédia:Unicode/Test

Vous pouvez, dans cette page, tester la présence sur votre système d’exploitation de polices permettant l’affichage de blocs de caractères nécessaires à la lecture de certains articles. Comparez ce que vous lisez dans la colonne Texte à l’image affichée. Si des carrés vides, des points d’interrogation ou autres apparaissent à la place des caractères attendus, reportez-vous à la page Unicode pour télécharger les polices idoines.

Rappelez-vous aussi qu’il est possible que des polices adaptées soient déjà installées, auquel cas c’est votre navigateur ou votre feuille de style qui est mal réglé : vérifiez la ou les polices que vous lui demandez d’utiliser pour l’affichage en vous reportant au manuel du logiciel.

Voir aussi : Wikipédia:Caractères spéciaux.

Écritures « simples »[modifier le code]

Caractères latins modifiés[modifier le code]

Ces caractères sont fréquemment utilisés dans les articles de linguistique et ceux consacrés aux écritures (en tant que caractères de transcription).

Texte testé	Image de référence
Voyelles ă ǎ ã ā ą ẵ a æ å ǻ a̤̐ ĕ ě ẽ ē ė ę ḗ ǝ ǝ̄ ĭ ǐ ĩ ī į ḭ ŏ ǒ õ ō ǫ ṏ ŭ ǔ ũ ū ų u̯ ů ỹ y˞ Consonnes bʱ č ć ç ḍ ð ǵ ģ ħ ḥ ḫ ƕ ǰ ḱ ḵ ķ l̥ ļ ṇ ń ṅ ņ ň ñ ŋ ł ṁ m̥ n̥ pˀ r̥ ř ŕ ṙ ṣ š ś ṭ þ ẋ ź ż ž

Blocs : latin de base, latin-1, latin étendu A, latin étendu B, latin étendu additionnel, lettres modificatives avec chasse et diacritiques.

Alphabet phonétique international[modifier le code]

L’alphabet phonétique international utilise un mélange de caractères latins (et grecs « latinisés »), de diacritiques et de caractères qui lui sont propres. L’exemple suivant ne comprend bien sûr pas toutes les possibilités.

Texte testé	Image de référence
ʒə nə konɛ ply pɛːʁsɔn ɑ̃ mase fɛʁgyːsɔn \|\| ʒəː ʁuːl aː vɛ̃ː a lœʁ \| syr mɔ̃ tʁaktœʁ ply ʁjɛ̃ nə mə fɛː pœːʁ \|\|

Blocs : extensions A.P.I., marques diacritiques, divers blocs latins (cf. précédemment).

Alphabet grec[modifier le code]

Système monotonique (moderne)[modifier le code]

L’affichage du grec monotonique (servant au grec moderne) ne soulève pas de problèmes importants : il est maintenant pris en charge par défaut dans la majorité des systèmes d’exploitation courants (GNU/Linux, Windows, Mac OS, etc.).

Texte testé	Image de référence
1 Στην αρχή ήταν ο Λόγος, και ο Λόγος ήταν μαζί με τον Θεό, και ο Λόγος ήταν Θεός. 2 Αυτός ήταν στην αρχή μαζί με τον Θεό. Évangile selon Jean (I, 1)

Système polytonique (ancien)[modifier le code]

De nombreux caractères étendus sont nécessaires au grec polytonique (servant principalement à noter le grec ancien). Dans le tableau suivant, lire correctement le texte tiré de l’Iliade garantit un affichage correct des articles consacrés au grec ancien ou qui en citent des mots. Parmi les caractères spéciaux indiqués, tous ne sont pas aussi importants ; ce sont principalement des lettres archaïques ou des variantes ainsi que des lettres coptes, qui seront cependant indispensables pour la lecture d’articles citant des textes épigraphiques voire pour ceux traitant des lettres en question et, plus généralement, de l’histoire de l’alphabet grec.

Texte testé

Image de référence

Μῆνιν ἄειδε, θεὰ, Πηληϊάδεω Ἀχιλῆος, οὐλομένην, ἣ μυρί᾿ Ἀχαιοῖσ᾿ ἄλγε᾿ ἔθηκεν πολλάς δ᾿ ἰφθίμους ψυχὰς Ἄϊδι προΐαψεν ἡρώων, αὐτοὺς δὲ ἑλώρια τεῦχε κύνεσσιν οἰωνοῖσί τε πᾶσι, Διὸς δ᾿ ἐτελείετο βουλή. Iliade (A, 1-5)
Caractères spéciaux :	ϐ ϑ ϖ ϗ Ϙϙ Ϛϛ Ϝϝ
	Ϟϟ Ϡϡ ϰ ϱ ϲ ϳ ϴ ϵ ϶
Lettres coptes : ϣ ϥ ϧ ϩ ϫ ϭ ϯ

Notes :

Actuellement, la prise en charge des claviers pour le grec ancien sous GNU/Linux ne permet pas, par défaut, de coder correctement les voyelles accentuées de l’alphabet grec : en effet, les caractères attendus sont remplacés par ceux du grec moderne, qui possèdent leur propre emplacement et sont, selon les polices, parfois affichés surmontés d’un accent droit et non d’un accent aigu oblique.
L’affichage d’un accent en forme de petit tilde latin (˜) au lieu de la forme d’un accent circonflexe latin (^) n’est pas incorrect en grec ; le tilde est correct historiquement, mais s’est transformé au cours du temps en accent circonflexe en grec moderne, et Unicode représente les deux formes avec un seul caractère diacritique, unifié avec l’accent circonflexe latin.
En revanche, l’esprit doux (en forme d’apostrophe courbée ou de petit coin supérieur droit, et qui représente une consonne étymologique absente) et les accents aigus et graves (traits non courbés et penchés) doivent clairement être distingués, et s’inscrivent à la gauche d’une lettre majuscule grecque, et non au-dessus (contrairement au tréma) ; ils peuvent se combiner avec la même lettre, l’esprit étant affiché à gauche de l’accent s'il s'agit d'une lettre majuscule ; par ailleurs, l’accent peut s’inscrire normalement au milieu d’un tréma.

Alphabet cyrillique[modifier le code]

Texte testé	Image de référence
Évangile selon Matthieu (VI, 9-11) Ѡ҅тьче нашъ иже еси на н҃бсхъ. Да с҃вт сѧ имѧ твое. Да придетъ цасрествие твое. Да бодетъ волѣ твоѣ. Ѣко на н҃бси и на ꙁеми. Хлѣбъ нашъ наставъшааго дьне. Даждъ намъ дънесь.

Les caractères suivants sont archaïques et moins fréquemment affichés par les polices courantes : Ѡ, ѧ, Ѣ et ѣ ainsi que les diacritiques о҅ et о҃. Cette lacune ne gênera cependant aucunement la lecture des articles courants citant des mots en cyrillique des langues modernes actuelles.

Alphabet tifinaghe[modifier le code]

Utilisé pour l’écriture du berbère.

Texte testé	Image de référence
ⴰⴳⵍⴷⵓⵏ ⴰⵎⵥⵥⴰ ⵙ ⵡⴰⵡⴰⵍ ⴳⵔⵉ ⵉⴷⵙ, ⵙⵙⵏⵖ ⵢⴰⵜ ⵜⵖⴰⵡⵙⴰ ⵜⵉⵙⵙ ⵙⵏⴰⵜ ⵉⵅⴰⵜⵔⵏ: ⵉⵜⵔⵉ ⵙⴳ ⴷⴷ ⵉⴷⴷⴰ ⵓⵔ ⵉⵎⵇⵇⵓⵔ, ⵉⵍⵍⴰ ⵖⴰⵙ ⴰⵏⵛⵜ ⵏ ⵢⴰⵜ ⵜⴰⴷⴷⴰⵔⵜ ! ⴰⵢⴰ ⵓⴽⵣⵖ ⵜ. ⵙⵙⵏⵖ ⵉⵙ ⴱⵕⵕⴰ ⵏ ⵉⵜⵔⴰⵏ ⵣⵓⵏⴷ ⴰⴽⴰⵍ, ⵊⵓⴱⵉⵜⵔ, ⵎⴰⵔⵙ, ⴱⵉⵏⵓⵙ — ⵉⵜⵔⴰⵏ ⵎⵉ ⵏⴽⴼⴰ ⵉⵙⵎⴰⵡⵏ — ⵍⵍⴰⵏ ⴷⵉⵖ ⵉⵜⵔⴰⵏ ⵢⴰⴹⵏ ⵎⵥⵥⵉⵢⵏⵉⵏ, ⵡⵉⵏⵏⴰ ⵓⵔ ⵏⵣⵎⵉⵔ ⴰⴷ ⵏⵥⵔ ⵙ ⵓⵜⵉⵍⵉⵙⴽⵓⴱ. ⴰⴷⴷⴰⵢ ⵢⵓⴼⴰ ⵓⴰⵙⵜⵕⵓⵏⵓⵎ ⵢⴰⵏ ⴷⵉⴳⵙⵏ, ⴷⴰ ⵢⴰⵙ ⵉⵜⵜⴳⴰ ⵙ ⵢⵉⵙⵎ ⵢⴰⵏ ⵡⵓⵜⵜⵓⵏ. ⴷⴰ ⵢⴰⵙ ⵉⵇⵇⴰⵔ ⵙ ⵓⵎⴷⵢⴰⵜ : « ⴰⵙⵜⵔⵓⵉⴷ 3251 ».

Bloc Unicode : Tifinaghe (U+2D30 à U+2D6F).

Syllabaires japonais[modifier le code]

On peut noter que ces écritures s’utilisent souvent conjointement avec les sinogrammes (dans leur forme japonaise qui peut selon les cas être traditionelle, ou parfois simplifiée), et il existe de nombreux cas où les caractères alphasyllabaires japonais sont disposés en blocs carrés dans leur forme réduite (souvent pour des abréviations ou mots d’usage courant). Certains diacritiques communs aux deux syllabaires peuvent s’y ajouter et se combiner pour distinguer des consonnes qui restent confondues dans le syllabaire non modifié : ces diacritiques (comme le ten) sont d’usage très courant et leur prise en charge est normalement requise dans toutes les polices japonaises.

Pour l’écriture idéographique kanji : 日本語, voir les sinogrammes ci-après.

Syllabaire hiragana[modifier le code]

Texte testé	Image de référence
あいうえおかきくけこ　がぎぐげごさしすせそ　ざじずぜぞたちつてと　だぢづでどなにぬねのはひふへほ　ばびぶべぼ　ぱぴぷぺぽまみむめもや　ゆ　よわゐ　ゑをん

Syllabaire katakana[modifier le code]

Texte testé	Image de référence
アイウエオカキクケコ　ガギグゲゴサシスセソ　ザジズゼゾタチツテト　ダヂヅデドナニヌネノハヒフヘホ　バビブベボ　パピプペポマミムメモヤ　ユ　ヨワヰ　ヱヲン

Alphabet runique[modifier le code]

L’alphabet runique des peuples nordiques anciens.

Texte testé	Image de référence
ᛡᛅᚱᛅᛚᛏᚱ ᛁᛅᛋ᛬ᛋᚫᛣ᛫ᚢᛅᚾ᛫ᛏᛅᚾᛉᛅᚢᚱᚴ ᛅᛚᛅ᛫ᛅᚢᚴ᛫ᚾᚢᚱᚢᛁᛅᚴ ᛫ᛅᚢᚴ᛫ᛏᛅᚾᛁ᛫ᚴᛅᚱᚦᛁ᛫ᚴᚱᛁᛋᛏᚾᚫ (Gravé sur la grosse pierre de Jelling)

Bloc : Runes (U+16A0 à U+16F0).

Écritures à rendu complexe[modifier le code]

Elles sont traitées à part :

Écritures alphabétiques de droite à gauche[modifier le code]

Test en hébreu ; voir aussi hébreu et alphabet hébreu.
Test en arabe ; voir aussi arabe et alphabet arabe.
Test en syriaque (page manquante à faire) ; voir aussi syriaque et alphabet syriaque.
Test en thâna (page manquante à faire) ; voir aussi divehi (ou maldivien) pour l’alphabet thâna.

Voir aussi texte bi-directionnel.

Alphasyllabaires indiens[modifier le code]

Ces écritures d’origine brahmique forment de nombreuses ligatures et formes contextuelles selon les voyelles et modifications semi-vocaliques de syllabes de base. Ce ne sont pas à proprement parler des alphabets, ni des syllabaires (ou alors ce sont des syllabaires à rendu complexe). Notez que certaines langues indiennes utilisent normalement l’alphabet arabe (par exemple l’ourdou), mais sont parfois transcrites en écriture devanagari ou latine.

Wikipédia:Unicode/Test/Langues indiennes.

Alphasyllabaire thaï[modifier le code]

Si vous utilisez Microsoft Internet Explorer, configurez votre navigateur en allant dans Démarrer > Outils > Panneau de configuration > Options Internet et en cliquant sur le bouton Polices... Choisissez Thaï dans le menu déroulant du haut et indiquez la police Tahoma.

Texte testé	Image de référence
วิกิพีเดีย สารานุกรมเสรี

Alphasyllabaire tibétain[modifier le code]

Texte testé	Image de licence CC BY-SA 3.0
༐ༀ་མ་ཎི་པ་དྨེ་ཧཱུྃ༐

Syllabaires et autres écritures « simples » utilisant un nombre étendu de glyphes[modifier le code]

Ces écritures sont facilement prises en charge, car elles ne nécessitent pas la prise en compte de nombreuses ligatures, ni la prise en charge d’un mode d’écriture bidirectionnel. Cependant, le nombre de glyphes à prendre en charge est important, et ces écritures demandent le plus souvent des polices spécifiques.

Syllabaire guèze[modifier le code]

Le syllabaire est utilisé en Afrique orientale (principalement en Éthiopie et Érythrée) pour l’écriture des textes écrits dans les langues suivantes :

Guèze (ancien amharique d’usage liturgique de l’Église chrétienne éthiopienne, également utilisé en Israël par la communauté juive Beta d’origine éthiopienne)
Amharique (moderne)
Tigrinya
Testez votre navigateur pour l’amharique

Alphabet coréen (hangeul)[modifier le code]

Bien que l’écriture hangeul utilise un alphabet très simple, elle se compose de façon complexe en groupes syllabiques, avec une syllabe par carré, et une disposition stricte dans le carré. Un nombre restreint de syllabes sont composées en coréen moderne, mais certaines syllabes du coréen ancien peuvent demander un rendu plus complexe.

Texte testé	Image de référence
한국어 한국어

Première ligne : syllabes précomposées, qui ne présentent pas de difficulté d’affichage particulière. Deuxième ligne : lettres (jamos) séparées, représentant le même texte, parfois affichées de la même manière (en carré) que la première ligne.

Caractères chinois (sinogrammes)[modifier le code]

Les sinogrammes peuvent se présenter en deux types selon leur présentation (apparence graphique) : les caractères traditionnels et les simplifiés. Les polices destinées à l’affichage du chinois ne sont pas toutes susceptibles de gérer les deux types à la fois.

Ils sont utilisés aussi en japonais dans une variante graphique appelée kanji, et furent aussi utilisés pour d’autres langues, comme le vietnamien avant sa conversion vers l’écriture latine, ou le coréen (dans sa variante hanja) avant sa conversion à l’alphabet hangeul, ou encore aujourd’hui pour la transcription de la langue mongolique (qui utilisait un syllabaire traditionnel) en Chine (mais en Mongolie, l’ancien syllabaire traditionnel a été remplacé par l’alphabet cyrillique).

Caractères traditionnels[modifier le code]

Texte testé	Image de référence
少小離家老大回、鄉音無改鬢毛摧。兒童相見不相識、笑問客從何處來？ He Zhizhang, Journal fortuit d’un retour au village natal

Caractères simplifiés[modifier le code]

Texte testé	Image de référence
少小离家老大回、乡音无改鬓毛摧。儿童相见不相识、笑问客从何处来？ He Zhizhang, Journal fortuit d’un retour au village natal

Flèches[modifier le code]

Texte testé	Image de référence
← ↑ → ↓ ↔ ↕ ↖ ↗ ↘ ↙ ↚ ↛ ↜ ↝ ↞ ↟ ↠ ↡ ↢ ↣ ↤ ↥ ↦ ↧ ↨ ↩ ↪ ↫ ↬ ↭ ↮ ↯ ↰ ↱ ↲ ↳ ↴ ↵ ↶ ↷ ↸ ↹ ↺ ↻ ↼ ↽ ↾ ↿ ⇀ ⇁ ⇂ ⇃ ⇄ ⇅ ⇆ ⇇ ⇈ ⇉ ⇊ ⇋ ⇌ ⇍ ⇎ ⇏ ⇐ ⇑ ⇒ ⇓ ⇔ ⇕ ⇖ ⇗ ⇘ ⇙ ⇚ ⇛ ⇜ ⇝ ⇞ ⇟ ⇠ ⇡ ⇢ ⇣ ⇤ ⇥ ⇦ ⇧ ⇨ ⇩ ⇪

Blocs situés hors du plan multilingue de base[modifier le code]

Le plan multilingue de base (ou PMB) définit des emplacements pour des caractères situés entre U+0000 et U+FFFF, soit 65536 emplacements (de 0 à 65535 compris), contenant la plupart des caractères et symboles utilisés dans les langues modernes actuelles.

Au-delà, hors du PMB, le codage des caractères peut soulever des problèmes pour certains systèmes d’exploitation et/ou navigateurs Internet ; en outre, rares encore sont les polices de caractères sachant coder et afficher les caractères en question, placés hors du PMB parce qu’ils sont d’usage beaucoup plus limité.

De fait, il est fréquent que les caractères hors du PMB ne soient pas affichés correctement, sauf si vous possédez le plan multilingue complémentaire et/ou un navigateur et une police sachant coder et afficher une ou plusieurs de ces langues.

Alphabet gotique[modifier le code]

Texte testé	Image de référence
𐌰𐌱𐌲𐌳𐌴𐌵𐌶𐌷𐌸𐌹𐌺𐌻𐌼𐌽𐌾𐌿𐍀𐍁𐍂𐍃𐍄𐍅𐍆𐍇𐍈𐍉𐍊

Bloc : Gotique (U+10330 à U+1034A).

Alphabet ougaritique[modifier le code]

Texte testé	Image de référence
𐎀𐎁𐎂𐎃𐎄𐎅𐎆𐎇𐎈𐎉𐎊𐎋𐎌𐎍𐎎 𐎏𐎐𐎑𐎒𐎓𐎔𐎕𐎖𐎗𐎘𐎙𐎚𐎛𐎜𐎝

Bloc : Ougaritique (U+10380 à U+1039D).