Caractère (informatique)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Caractère.

En informatique, le caractère est un type de données et une notion abstraite. Comme en typographie, un caractère informatique peut représenter une lettre minuscule, une lettre majuscule, un chiffre ou un signe de ponctuation, mais aussi une espace typographique, une tabulation, un retour à la ligne et quelques autres opérations spéciales (sonnerie, effacement, etc.).

Comme les ordinateurs fonctionnent en binaire, un numéro est attribué à chaque caractère. Ce numéro peut être codé avec un certain nombre de bits ; par exemple 8 bits, soit un octet, permettent de représenter 256 numéros, donc 256 caractères, différents.

Il existe plusieurs normes de codage de caractères dont, parmi les plus connus, ASCII, ISO 8859, et Unicode. Ces normes peuvent diffèrer dans le nombre de caractères couverts, ainsi que dans la conversion en binaire des numéros. Ainsi, le caractère «  » n'existe pas en ASCII, a le numéro 164 en ISO 8859-15, et le numéro 8364 en Unicode. Sept bits suffisent pour coder tous les caractères de la norme ASCII, mais il en faut 8 (un octet) pour ISO 8859, et plus de 16 pour Unicode. Il existe plusieurs représentations binaires différentes d'Unicode, dont UTF-8 et UTF-16. Il faut trois octets pour coder le 8364 de « € » en UTF-8, contre deux octets en UTF-16.

Les caractères informatiques permettent de directement représenter un texte brut, avec les espaces et les retours à la ligne, mais sans formatage plus élaboré (choix de fonte de caractères, couleur de texte, taille des caractères, etc.). Les caractères spéciaux étaient surtout utilisés par le matériel informatique (terminaux et imprimantes) d'avant les années 1990 qui ne fonctionnait qu'en mode texte.

L'affichage d'un caractère sur un moniteur d'ordinateur ou son impression avec une imprimante nécessite les données spécifiant le dessin exact du caractère, le glyphe. Comme en typographie, un ensemble de glyphes d'une même famille de caractères est une police de caractères.

Très souvent les ordinateurs traitent des mots, des phrases, des paragraphes entiers. Il existe un type de données pour représenter une suite de caractères, c'est la chaîne de caractères.

[modifier] Voir aussi

Outils personnels
Espaces de noms
Variantes
Actions
Navigation
Contribuer
Imprimer / exporter
Boîte à outils
Autres langues