Comma-separated values

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir CSV.
Comma-separated values
Extension .csv
Type MIME text/csv
Type de format fichier texte
Standard(s) (en) RFC 4180
Spécification Format ouvert

Comma-separated values, connu sous l'acronyme CSV, est un format informatique ouvert représentant des données tabulaires sous forme de valeurs séparées par des virgules.

Ce format n'a jamais vraiment fait l'objet d'une spécification formelle. Toutefois, la note 4180 décrit la forme la plus courante et établit son type MIME "text/csv", enregistré auprès de l'IANA.

Un fichier CSV est un fichier texte, par opposition aux formats dit « binaires ». Chaque ligne correspond à une rangée du tableau et les cellules d'une même rangée sont séparées par une virgule.

Une ligne est une suite ordonnée de caractères terminée par un caractère de fin de ligne (line break – CRLF), la dernière ligne pouvant être exemptée de ce dernier.


Par exemple :

  • Sexe, Prénom,Année de naissance
  • M,Alphonse,1932
  • F,Béatrice,1964
  • F,Charlotte,1970

représente les données suivantes :

Sexe Prénom Année de naissance
M Alphonse 1932
F Béatrice 1964
F Charlotte 1970

Sommaire

[modifier] Variantes françaises

Le fait que les fichiers CSV soient essentiellement utilisés autour du logiciel Microsoft Excel, et que les séparateurs ne soient pas standardisés (virgules, points-virgules sous certaines localisations dont la française, etc.) rend ce format peu pratique pour une utilisation autre que des échanges de données ponctuels. Ce format est toutefois assez populaire parce qu'il semble relativement facile à générer.

Les champs texte peuvent également être délimités par des guillemets. Lorsqu'un champ contient lui-même des guillemets, ils sont doublés afin de ne pas être considérés comme début ou fin du champ. Si un champ contient un signe utilisé comme séparateur (virgule, point-virgule, etc.), les guillemets sont obligatoires afin que ce signe ne soit pas confondu avec un séparateur.

Exemple, avec des champs séparés par des points-virgules et des guillemets :

Robert;Dupont;rue du Verger, 12;...
"Michel";"Durand";" av. de la Ferme, 89 ";...
"Michel ""Michele""";"Durand";" av. de la Ferme, 89";...
"Michel;Michele";"Durand";"av. de la Ferme, 89";...

Ce texte représente les données suivantes :

Robert Dupont rue du Verger, 12 ...
Michel Durand av. de la Ferme, 89 ...
Michel "Michele" Durand av. de la Ferme, 89 ...
Michel;Michele Durand av. de la Ferme, 89 ...

[modifier] Alternatives

Le format CSV présente entre autres inconvénients d'être interprété par Microsoft Excel, comme étant au format anglais (séparateur de colonnes : virgule ; séparateur de décimales : point) ou français de France (séparateur de colonnes : point-virgule ; séparateur de décimales : virgule) en fonction de l'origine du fichier : sur disque, par HTTP, support amovible...

Le format SYLK présente l'avantage d'être un format texte et d'être indépendant de la langue de Microsoft Excel (anglais, français, ...). Il peut intégrer des formules mathématiques simples et contrôler certaines propriétés des cellules. De plus, les cellules du tableur peuvent être remplies dans le désordre.

Un simple tableau au format HTML peut aussi être une alternative, puisque les dernières versions de Microsoft Excel acceptent depuis quelques années ce format en entrée.

[modifier] Voir aussi

[modifier] Article connexe

[modifier] Liens externes

  • (en) RFC 4180: Common Format and MIME Type for Comma-Separated Values (CSV) Files
  • csvdiff
  • cvs2wp page permettant de transformer un fichier CSV en tableau html ou mediawiki
Outils personnels
Espaces de noms
Variantes
Actions
Navigation
Contribuer
Imprimer / exporter
Boîte à outils
Autres langues