Comma-separated values

Un article de Wikipédia, l'encyclopédie libre.

Page d'aide sur l'homonymie Pour les articles homonymes, voir CSV.
Comma-separated values

Extension de fichier

.csv

Type MIME

text/csv

Type de format

fichier texte

Standard(s)

(en) RFC 4180

Spécification

Format ouvert

Comma-separated values (CSV) est un format informatique ouvert représentant des données tabulaires sous forme de « valeurs séparées par des virgules ».

Ce format n'a jamais vraiment fait l'objet d'une spécification formelle. Toutefois, la RFC 4180 décrit la forme la plus courante et établit son type MIME "text/csv", enregistré auprès de l'IANA.

Un fichier CSV est un fichier texte (par opposition aux formats dit « binaires »). Chaque ligne correspond à une rangée du tableau et les cellules d'une même rangée sont séparées par une virgule.

Une ligne est une suite ordonnée de caractères terminée par un caractère de fin de ligne (line break – CRLF), la dernière ligne pouvant être exempt de ce dernier.


Par exemple :

Sexe,Prénom,Année de naissance
M,Alphonse,1932
F,Béatrice,1964
F,Charlotte,1970

représente les données suivantes :

Sexe Prénom Année de naissance
M Alphonse 1932
F Béatrice 1964
F Charlotte 1970

[modifier] Variantes françaises

Le fait que les fichiers CSV soient essentiellement utilisés autour du logiciel Microsoft Excel, et que les séparateurs ne soient pas standardisés (virgules, points-virgules (sous certaines localisations dont la française), etc.) rend ce format peu pratique pour une utilisation autre que des échanges de données ponctuelles. Ce format est toutefois assez populaire parce qu'il est relativement facile à générer.

Les champs texte peuvent également être délimités par des guillemets (1). Lorsqu'un champ contient lui-même des guillemets (2), ils sont doublés afin de ne pas être considérés comme début ou fin du champ. Si un champ contient le séparateur (3) (virgule, points-virgules, etc.), il est obligatoire d'ajouter des guillemets afin que le séparateur soit échappé.

Exemple, avec des champs séparés par des points-virgules et des guillemets :

Robert;Dupont;rue du Verger, 12;...
(1) " Michel " ; " Durand " ; " av. de la Ferme, 89 ";...
(2) " Michel ""Michele"" " ; Durand ; " av. de la Ferme, 89 ";...
(3) " Michel;Michele " ; " Durand ";" av. de la Ferme, 89 ";...

[modifier] Alternatives

Le format CSV présente entre autres désavantages d'être interprété par Excel, comme étant au format anglais (séparateur de colonnes : virgule ; séparateur de décimales : point) ou français de France (séparateur de colonnes : point-virgule ; séparateur de décimales : virgule) en fonction de l'origine du fichier : sur disque, par HTTP, support amovible...

Le format SYLK présente l'avantage d'être un format texte et d'être indépendant de la langue d'Excel (anglais, français, ...). Il peut intégrer des formules mathématiques simples et contrôler certaines propriétés des cellules. De plus, les cellules du tableur peuvent être remplies dans le désordre.

Un simple tableau au format HTML peut aussi être une alternative, puisque les dernières versions d'Excel acceptent depuis quelques années, ce format en entrée.

[modifier] Voir aussi

Créer un livre