GIGO

Un article de Wikipédia, l'encyclopédie libre.

En informatique, GIGO (garbage in, garbage out) est le concept selon lequel des données d'entrée défectueuses ou absurdes produisent des sorties absurdes ou "déchets". Au Royaume-Uni, le terme parfois utilisé est « rubbish in, rubbish out » (RIRO)[1],[2].

Le principe s'applique également de manière plus générale à toute analyse et logique, en ce sens que les arguments ne sont pas valables si leurs prémisses sont erronées.

Historique[modifier | modifier le code]

L'expression est populaire à la naissance de l'informatique, et s'applique encore plus aujourd'hui puisque les ordinateurs récents peuvent produire de plus grandes quantités de données ou d'informations erronées en peu de temps. La première utilisation de ce terme remonte à un article du 10 novembre 1957 de l'agence de presse The Times of Northwest Indiana sur les mathématiciens de l'armée américaine et leur travail avec les premiers ordinateurs[3]. William D. Mellin y décrit que les ordinateurs ne peuvent pas penser par eux-mêmes et que des entrées "mal programmées" conduisent inévitablement à des sorties incorrectes. Une remarque similaire est noté par un des précurseurs de l'informatique :

On two occasions I have been asked, "Pray, Mr. Babbage, if you put into the machine wrong figures, will the right answers come out?" ... I am not able rightly to apprehend the kind of confusion of ideas that could provoke such a question.

« À deux reprises on m'a demandé, "S'il vous prie, Mr. Babbage, si vous mettez dans la machine des chiffres erronés, les bonnes réponses sortiront-elles ?" ... Je ne suis pas en mesure d'appréhender correctement le type de confusion d'idées que pourrait provoquer une telle question. »

— Charles Babbage, Passages from the Life of a Philosopher[4]

Plus récemment, la Marine Accident Investigation Branch parvient à une conclusion similaire :

A loading computer is an effective and useful tool for the safe running of a ship. However, its output can only be as accurate as the information entered into it.

« Un ordinateur de chargement est un outil efficace et utile pour la sécurité du fonctionnement d'un navire. Toutefois, ses données de sortie ne peuvent être qu'aussi justes que les informations qui y sont entrées. »

MAIB, dépliant sur la sécurité Hoegh Osaka: Listing, flooding and grounding on 3 January 2015[5]

Le terme pourrait être dérivé de last-in, first out (LIFO) ou first-in, first out (FIFO)[6].

Decision-makers increasingly face computer-generated information and analyses that could be collected and analyzed in no other way. Precisely for that reason, going behind that output is out of the question, even if one has good cause to be suspicious. In short, the computer analysis becomes a credible references point although based on poor data.

« Les décideurs sont de plus en plus confrontés à des informations et des analyses générées par ordinateur qui ne pourraient être collectées et analysées d'aucune autre manière. C'est précisément pour cette raison qu'il est hors de question d'aller au-delà de ces résultats, même si l'on a de bonnes raisons d'être méfiant. En bref, l'analyse informatique devient un point de référence crédible bien qu'elle soit basée sur des données médiocres.[7] »

Usage[modifier | modifier le code]

Ce terme peut également être utilisé pour décrire un fichier audio ou vidéo numérique de mauvaise qualité [réf. souhaitée]. Bien que la numérisation puisse être la première étape du nettoyage d'un signal analogique, elle n'améliore pas la qualité du fichier: les défauts originels seront toujours enregistrés, mais pourront être identifiés et éliminés lors d'une étape ultérieure par le traitement numérique du signal.

GIGO est couramment utilisé pour décrire des erreurs dans la prise de décision, dues à des données erronées, incomplètes ou imprécises. Cet usage e est antérieur à l'ère informatique[Information douteuse], mais le terme peut encore être appliqué. [réf. souhaitée]

GIGO était aussi le nom d'un programme passerelle de Usenet vers FidoNet, MAUSnet, entre autres.[8]

En statistique[modifier | modifier le code]

Une analyse statistique est toujours possible avec des données incorrectes. Même si elles peuvent entraver une analyse correcte[9], les données peuvent toujours être traitées. D'où l'importance de connaitre les conditions de récupération de l'échantillon.

Le proverbe "une horloge cassée a raison deux fois par jour" en est un exemple : ce 'résultat' peut être défini comme partiellement correct, en notant que certains réglages de l'heure ne sont corrects que deux fois par jour, lorsqu'accidentellement l'observation coïncide avec le résultat attendu

En outre, les données qui représente un décompte, même incorrect, n'affecte pas la précision de celles-ci[10].

Voir aussi[modifier | modifier le code]

Références[modifier | modifier le code]

  1. (en-GB) « Machine learning collaborations accelerate materials discovery », sur Physics World, (consulté le 3 août 2020)
  2. (en) John Adair, The Art of Creative Thinking: How to be Innovative and Develop Great Ideas, Kogan Page Publishers, (ISBN 978-0-7494-6008-2, lire en ligne)
  3. « Clipped From The Times », The Times,‎ , p. 65 (lire en ligne, consulté le 3 août 2020)
  4. (en) Charles Babbage et Green, Longman, Roberts and Green Longman, Passages from the life of a philosopher, (OCLC 258982, lire en ligne)
  5. (en) MAIB, « Hoegh Osaka: Listing, flooding and grounding on 3 January 2015 », sur https://gov.uk,
  6. (en-GB) « World Wide Words: Garbage in, garbage out », sur World Wide Words (consulté le 3 août 2020)
  7. (en) Daniel T. Brooks, Computer Applications in Particular Industries: Securities, Computers & The Law, American Bar Association, Section of Science and Technology, , 3e éd., p. 250, 253
  8. (en) jfesler, « GIGO History · GIGO », sur gigo.com, (consulté le 3 août 2020)
  9. (en-US) « How Anomalies Can Wreck Your Data (Garbage In, Garbage Out) », sur Heap, (consulté le 3 août 2020)
  10. (en) Jim Fowler, Phil Jarvis et Mel Chevannes, Practical Statistics for Nursing and Health Care.,  :

    « A hospital bed, in general, does not usually have half a person, unless one person is sprawled across more than one bed, or . . . something else found in battlefield situations. »