Windows-1252
Un article de Wikipédia, l'encyclopédie libre.
Windows-1252 ou CP1252 est un jeu de caractères disponible sur le système d'exploitation Microsoft Windows, aux États-Unis, et dans certains pays de l'Union européenne.
Sommaire |
[modifier] Contexte
Au début des années 1990, l'utilisation de l'encodage Windows-1252 se développe en Occident, avec la diffusion de Windows 3.0, Windows 3.1 et ses successeurs (notamment Windows 95, 98, NT, 2000, XP, Vista). À cette époque, le jeu de caractères Windows-1252 se substitue aux jeux de caractères DOS, c'est-à-dire à la page de code 437 dans les pays anglophones, et à la page de code 850 dans la plupart des pays d'Europe de l'Ouest. L'ensemble des logiciels développés pour Windows fonctionne alors avec cet ensemble de caractères.
Toutefois, sous l'influence des problèmes d'interopérabilité, des régions francophones-multilingues (Union européenne, Maghreb) ainsi que de la mondialisation des échanges et du développement d'Internet en particulier, et bien que l'encodage Windows-1252 reste très utilisé, cet encodage subit la concurrence et le développement d'Unicode.
[modifier] Aspects techniques
Windows-1252 est une extension de l'ISO/CEI 8859-1 : il diffère de l'ISO-8859-1 par l'utilisation de caractères imprimables, plutôt que des caractères de contrôle, dans les codes 128 à 159. Windows appelle ceci de manière générique ANSI, mais en fonction de l'endroit où le système d'exploitation a été vendu, l'ensemble de caractères peut avoir un autre nom, comme par exemple CP1252 aux États-Unis ou, dans les pays de l'Europe de l'Ouest, le nom validé par l'IANA, Windows-1252.
[modifier] Support en HTML
Les standards stipulent qu'Unicode est la seule référence en matière de codes de caractère en HTML. Cependant, l'usage de Windows-1252 est si répandu que plusieurs navigateurs supportent les références numériques de caractères pour les codes 128 à 159, alors qu'ils ne correspondent qu'à Windows-1252. Ainsi, le symbole « € » est le caractère Unicode numéro 8364, donc € est la référence numérique standard de « € » ; mais comme « € » est le caractère Windows-1252 numéro 128, certains navigateurs supportent aussi € comme référence numérique de ce caractère.[1]
Le tableau suivant montre Windows-1252. Les numéros 81, 8D, 8F, 90, et 9D ne sont pas utilisés et sont signalés par la couleur vert pâle. Les changements par rapport à ISO-8859-1 sont signalés par la couleur jaune.
| Windows-1252 (CP1252) | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
| 0x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
| 1x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
| 2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
| 5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
| 6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
| 7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
| 8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | Š | ‹ | Œ | Ž | |||
| 9x | ‘ | ’ | “ | ” | • | – | — | ˜ | ™ | š | › | œ | ž | Ÿ | ||
| Ax | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | | ® | ¯ |
| Bx | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
| Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
| Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
| Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
| Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |

