Normalisation Unicode
Un article de Wikipédia, l'encyclopédie libre.
| Unicode |
|---|
| Jeux de caractères |
| Équivalences normalisées |
Propriétés et algorithmes
|
| Codage |
| Autres transformations |
| Applications d'échanges de données |
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
Sommaire |
[modifier] NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
- Exemples
| caractères | forme normalisée |
||
|---|---|---|---|
| à | a + ̀ | = | a + ̀ |
| ẹ́ | e + ́ + ̣ | → | e + ̣ + ́ |
| ñ | ñ | → | n + ̃ |
| Ω (ohm) | Ω | → | Ω (omega) |
| fi (ligature) | fi | = | fi |
| ² | ² | = | ² |
[modifier] NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
- Exemples
| caractères | forme normalisée |
||
|---|---|---|---|
| à | a + ̀ | → | à |
| ẹ́ | e + ́ + ̣ | → | ẹ + ́ |
| ñ | ñ | → | ñ |
| Ω (ohm) | Ω | → | Ω (omega) |
| fi (ligature) | fi | = | fi |
| ² | ² | = | ² |
[modifier] NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
- Exemples
| caractères | forme normalisée |
||
|---|---|---|---|
| à | a + ̀ | = | a + ̀ |
| ẹ́ | e + ́ + ̣ | → | e + ̣ + ́ |
| ñ | ñ | → | n + ̃ |
| Ω (ohm) | Ω | → | Ω (omega) |
| fi (ligature) | fi | = | f + i |
| ² | ² | → | 2 |
[modifier] NFKC
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
- Exemples
| caractères | forme normalisée |
||
|---|---|---|---|
| à | a + ̀ | → | à |
| ẹ́ | e + ́ + ̣ | → | ẹ + ́ |
| ñ | ñ | = | ñ |
| Ω (ohm) | Ω | → | Ω (omega) |
| fi (ligature) | fi | → | f + i |
| ² | ² | → | 2 |

