Données brutes

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
image illustrant l’informatique
Cet article est une ébauche concernant l’informatique et le Web sémantique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Ce modèle est-il pertinent ? Cliquez pour en voir d'autres.
Cet article ne cite pas suffisamment ses sources (janvier 2015).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références » (modifier l'article, comment ajouter mes sources ?).

Les données brutes (aussi connu comme données primaires) sont les données non interprétées émanant d'une source primaire, ayant des caractéristiques liées à celle-ci et qui n'ont été soumises à aucun traitement ou toute autre manipulation.

Les données brutes peuvent être entrées dans un programme informatique ou utilisées dans des procédures manuelles telles que l'analyse statistique d'une enquête.

Il peut s'agir des données binaires des périphériques de stockage électroniques comme les lecteurs de disque dur[1].

Limites[modifier | modifier le code]

Les données brutes contiennent des informations plus ou moins factuelles. Elles sont souvent quantitatives[2], supposées fiables si l'instrument qui les a produites, a été convenablement étalonné et si le processus de collecte n'est pas biaisé et si elles sont correctement contextualisées.

Dans le domaine de la recherche scientifique (où il faut pouvoir répéter une expérience pour la contrôler ou valider), les faits présentés ou validés sans fournir un accès aux données brutes sont de plus en plus soumis à caution[3]. Il devient suspect de ne pas les conserver car depuis quelques années, les coûts de stockage ont diminué et il y a eu une multiplication des scandales portant sur les erreurs des connaissances induites à partir de données brutes[4].

Cependant, selon Geoffrey C. Bowker (2005), « Nous devons ouvrir le débat – alors qu’il n’en existe aucun de sérieux actuellement – à propos des différentes temporalités, spatialités et matérialités que nous sommes susceptibles de représenter grâce à nos bases de données, avec, en vue, une conception permettant une flexibilité maximum, et autorisant, autant que possible, l’émergence d’une polyphonie et d’une polychronie. L’expression “données brutes” est un oxymore autant qu’une mauvaise idée; au contraire, les données devraient être cuisinées avec soin. »[5].

Notes et références[modifier | modifier le code]

  1. Dans tous les articles, les auteurs s’attachent scrupuleusement aux faits, aux données brutes et concrètes : pas de bavardage, pas d’interprétations oiseuses, mais des informations précises étayées par des citations sourcées.'Bulletin critique du livre français, no  666-669, Association pour la diffusion de la pensée française, 2005, p. 5
  2. Le Manuel du Knowledge Management, mettre en réseau les hommes et les savoirs pour créer de la valeur, Dunod 2007
  3. [PDF]Promouvoir une recherche intègre et responsable, Comité d’éthique du CNRS, juillet 2014
  4. Reinhart et Rogoff corrigent leurs erreurs de calcul sur l'austérité, l'Expansion.com, publié le 10/05/2013
  5. Bowker, G. C. (2005) Memory Practices in the Sciences. MIT Press, Cambridge, Massachusetts(voir p. 183-184)