Normalisation Unicode
Un article de Wikipédia, l'encyclopédie libre.
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
Sommaire |
[modifier] NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
| châine | caractères | caractères normalisés |
chaîne normalisée |
|
|---|---|---|---|---|
| À | A + ◌̀ | = | A + ◌̀ | À |
| ẹ́ | e + ◌́ + ◌̣ | → | e + ◌̣ + ◌́ | ẹ́ |
| ñ | ñ | → | n | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | = | fi | fi (ligature) |
| ² (exposant) | ² | = | ² | ² (exposant) |
| 한 | 한 | → | ᄒ + ᅡ + ᆨ | 학 |
| が | か + ◌゙ | = | か + ◌゙ | が |
| ئ | ئ | → | ي + ◌ٔ | ئ |
[modifier] NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
| châine | caractères | caractères normalisés |
chaîne normalisée |
|
|---|---|---|---|---|
| À | A + ◌̀ | → | À | À |
| ẹ́ | e + ◌́ + ◌̣ | → | ẹ + ◌́ | ẹ́ |
| ñ | ñ | = | ñ | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | = | fi | fi (ligature) |
| ² (exposant) | ² | = | ² | ² (exposant) |
| 한 | 한 | = | 한 | 한 |
| が | か + ◌゙ | → | が | が |
| ئ | ئ | = | ئ | ئ |
[modifier] NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
| châine | caractères | caractères normalisés |
chaîne normalisée |
|
|---|---|---|---|---|
| À | A + ◌̀ | = | A + ◌̀ | À |
| ẹ́ | e + ◌́ + ◌̣ | → | e + ◌̣ + ◌́ | ẹ́ |
| ñ | ñ | → | n | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | = | f + i | fi |
| ² (exposant) | ² | = | 2 | 2 |
| 한 | 한 | → | ᄒ + ᅡ + ᆨ | 학 |
| が | か + ◌゙ | = | か + ◌゙ | が |
| ئ | ئ | → | ي + ◌ٔ | ئ |
[modifier] NFKC
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
| châine | caractères | caractères normalisés |
chaîne normalisée |
|
|---|---|---|---|---|
| À | A + ◌̀ | → | À | À |
| ẹ́ | e + ◌́ + ◌̣ | → | ẹ + ◌́ | ẹ́ |
| ñ | ñ | = | ñ | ñ |
| fi (ligature) | fi | = | f + i | fi |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| ² (exposant) | ² | = | 2 | 2 |
| 한 | 한 | → | 한 | 한 |
| が | か + ◌゙ | → | が | が |
| ئ | ئ | = | ئ | ئ |