ISO/CEI 8859-15

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

{{Infobox/Ligne mixte optionnelle

ISO 8859-15
Famille ISO 8859
Langues allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes).
Nombre de caractères 96
État du projet normalisé
Plates-formes Unix/Linux
Organisme /
Parrainage
ISO/ Canada (Standards Council of Canada/Conseil canadien des normes), Danemark (Dansk

Standard), Finlande (SFS – STY/Tieke), France (AFNOR – Association française de normalisation), Irlande (NSAI – National Standards Authority of Ireland)

Numéro d'enregistrement 203
Séquences d'échappement G1: ESC 02/13 06/02
G2: ESC 02/14 06/02
G3: ESC 02/15 06/02
Unité de codage (codet) 7 à 8 bits
Première version 16 septembre 1998
Dernière version


Site web http://www.itscj.ipsj.or.jp/ISO-IR/203.pdf

L'ISO/CEI 8859-15 (aussi connue comme Latin-9 et non officiellement comme Latin-0, mais jamais comme Latin-15) est la 15e partie de la norme de codage de caractères ISO 8859 de l'Organisation internationale de normalisation (ISO).

Cette norme donne un code numérique tenant sur bits aux caractères de l'alphabet latin utilisés en allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes).

Différences avec ISO 8859-1[modifier | modifier le code]

Le jeu de caractères ISO/CEI 8859-15 peut être considéré comme une mise à jour de la norme ISO 8859-1, avec laquelle il est identique à l'exception de huit caractères[1].

Différences ISO 8859-15 — ISO 8859-1
Position 0xA4 0xA6 0xA8 0xB4 0xB8 0xBC 0xBD 0xBE
8859-1 ¤ ¦ ¨ ´ ¸ ¼ ½ ¾
8859-15 Š š Ž ž Œ œ Ÿ

Note : les codes numériques sont donnés en base hexadécimale.

Le symbole de l’euro est devenu nécessaire dans la perspective de l’introduction imminente de la monnaie unique. Š, š, Ž et ž s’utilisent dans des mots d’emprunt et dans la translittération de noms russes en finnois et en estonien. Œ and œ sont des digrammes soudés français, et le Ÿ est nécessaire pour l’écriture tout-en-capitales des noms propres comme celui de la ville de l'Haÿ-les-Roses et celui du poète et écrivain Pierre Louÿs. Étant donné que les diacritiques sur les majuscules sont souvent (mais improprement[2]) omis en français, on a cru pouvoir faire l’économie d’un point de code pour l’Ÿ dans ISO-8859-1, bien que sa minuscule ÿ y soit bien représentée (à 0xFF).

En revanche, quelques caractères peu utilisés ont été exclus.

Caractères supportés[modifier | modifier le code]

Le jeu de caractères complet est présenté dans le tableau ci-après.

ISO/CEI 8859-15
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x non utilisé
1x
2x ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x non utilisé
9x
Ax   ¡ ¢ £ ¥ Š § š © ª « ¬ ­ ® ¯
Bx ° ± ² ³ Ž µ · ž ¹ º » Œ œ Ÿ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Dans la table ci-dessus, 20 est l'espace standard, A0 est l'espace insécable.

Les valeurs 00-1F, 7F, et 80-9F ne sont pas assignées à des caractères par l'ISO/CEI 8859-15.

Carte complète de l'ISO 8859-15 avec les différences par rapport à l'ISO 8859-1 marquées par un fond jaune (jaune) :

ISO 8859-15
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2x SP  ! " # $  % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9  :  ; < = >  ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ DEL
8x PAD HOP BPH NBH IND NEL SSA ESA HTS HTJ VTS PLD PLU RI SS2 SS3
9x DCS PU1 PU2 STS CCH MW SPA EPA SOS SGCI SCI CSI ST OSC PM APC
Ax NBSP ¡ ¢ £ ¥ Š § š © ª «  ¬ ­ ® ¯
Bx ° ± ² ³ Ž µ · ž ¹ º  » Œ œ Ÿ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Normalisation[modifier | modifier le code]

Le jeu de caractères ISO/CEI 8859-15 a été normalisé le 16 septembre 1998 sous le nom officiel de « Jeu supplémentaire latin pour l’Europe (« latin 9 ») ». Il définit 96 caractères graphiques.

Ce jeu de caractères est utilisables avec l’IRV de l’ISO/CEI 646 (ISO-IR 6) que ce soit dans un contexte 8 bits ou 7 bits, au travers de la technologie de l’ISO/CEI 2022. Il dérive du «latin no 1 (ISO-IR 100)» dont certains caractères ont été remplacés pour le français, le finnois, et le symbole Euro (€).

La normalisation du 16 septembre 1998 définit trois séquences d'échappement[3]:

  • G1: ESC 02/13 06/02
  • G2: ESC 02/14 06/02
  • G3: ESC 02/15 06/02

En mode 8 bits, il est plus ou moins interopérable avec le windows-1252, dans la mesure où certains caractères sont affectés identiquement.

Usages et applications[modifier | modifier le code]

Avec l'arrivée de l'Euro, ce jeu s'est imposé en Europe comme le standard Unix/Linux, avant l'arrivée d'UTF-8. La plupart des logiciels fonctionnant avec des caractères mono-octets et ne dépendant pas d'un ordre spécifique des caractères ont pu continuer à fonctionner à l'identique.

Aujourd'hui, son usage s'efface au profit de l'UTF-8.

Aspects économiques et sociaux[modifier | modifier le code]

La norme a été sponsorisée par le Canada (Standards Council of Canada/Conseil canadien des normes), le Danemark (Dansk Standard), la Finlande (SFS – STY/Tieke), la France (AFNOR – Association française de normalisation), et l'Irlande (NSAI – National Standards Authority of Ireland).

La norme est disponible en langues françaises et anglaise, elle est vendue à 66 francs suisses[4].

La coexistence de normes de codages partiellement incompatibles conduit à la disparition du symbole euro de certains documents.

En informatique, il n’est pas exceptionnel de rencontrer un usage fautif du code 128 de Windows-1252 là où les normes stipulent que le codage Unicode ou ISO 8859-1 est utilisé. En particulier, en HTML et XML, l’entité numérique &#128; n’est pas valable ; le symbole euro doit être représenté avec l’entité numérique &#8364;. En outre, dans un texte codé en ISO 8859-1 ou ISO 8859-15, le code 128 ne représente pas le symbole euro ; ISO 8859-1 ne permet pas de représenter le symbole euro et ISO 8859-15 utilise le code 164.

Notes et références[modifier | modifier le code]

  1. (en) « ISO-8859-15 », sur IANA (consulté le 8 mars 2016)
  2. « Accentuation des majuscules », Académie française : « On veille donc, en bonne typographie, à utiliser systématiquement les capitales accentuées ... [One takes care then, in good typography, to use accented capitals systematically ...] »
  3. http://www.itscj.ipsj.or.jp/ISO-IR/203.pdf
  4. http://www.iso.org/iso/catalogue_detail?csnumber=29505

Annexes[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]