Oubli de la fréquence de base

Un article de Wikipédia, l'encyclopédie libre.

L'oubli de la fréquence de base (aussi connue sous le nom de négligence de la taille de l'échantillon) est un biais cognitif lié aux lois statistiques, qui se manifeste par le fait que les gens oublient souvent de considérer la fréquence de base de l'occurrence d'un événement lorsqu'ils cherchent à en évaluer une probabilité.

Le plus souvent, cela conduit à surestimer cette probabilité.

Historique[modifier | modifier le code]

Dans les années 1970, les psychologues et économistes D. Kahneman et A. Tversky ont mené une série d'expériences mettant en évidence les erreurs dues à l'oubli de la fréquence de base, y compris dans des populations de sujets hautement diplômés.

Exemple didactique : caméras de surveillance[modifier | modifier le code]

Diagramme de Venn illustrant l'oubli de la fréquence de base. La disproportion entre la taille de la population délinquante, la population déclenchant l'alerte et la population générale augmente considérablement le risque d'erreur.

Soit une ville d'un million individus présents sur son territoire. Sur ce million (1 000 000) d'individus, 100 sont des délinquants présumés et répertoriés comme tels sur une liste, les 999 900 autres étant présumés non-délinquants.

Afin de détecter la présence d'un délinquant sur son territoire, la ville installe des caméras de vidéosurveillance avec un dispositif de reconnaissance faciale automatique : celui-ci doit déclencher une alerte dès lors que le visage filmé est celui d'un des 100 délinquants de la liste.

Malheureusement, le dispositif de reconnaissance faciale n'est pas parfait. Supposons qu'il ait un « taux d'erreur soit de 1 % », ou, plus précisément, que :

Lorsqu'une alerte se déclenche, quelle est la probabilité que l'on soit en présence d'un délinquant répertorié sur la liste ?

Si l'on raisonne avec « oubli de la fréquence de base », c'est-à-dire en ne retenant que le « taux d'erreur est de 1 % », on répond un peu rapidement qu'il y a 99 % de probabilité que l'individu soit effectivement un délinquant lorsqu'une alerte est déclenchée.

Ce qui est erroné.

En effet, lorsqu'on comptabilise l'ensemble des alertes, deux situations se présentent :

  • 99 % des délinquants déclenchent l'alerte, soit 99 délinquants sur les 100 de la liste
  • 1 % des non-délinquants déclenchent l'alerte, soit 9 999 non-délinquants sur 999 900.
  • Soit un total de 99+9999=10 098 alertes.

Lorsqu'une alerte se déclenche, la probabilité que l'individu soit effectivement un délinquant est donc de 99 sur 10 098, soit 0,98 % et non de 99 % !

Cette probabilité peut être retrouvée par le théorème de Bayes.

Cas avéré : l'accident de la navette Challenger[modifier | modifier le code]

Dans les annotations apportées par Richard Feynman aux conclusions de l'enquête sur l'accident de la navette spatiale Challenger[1], il considère que ce biais cognitif a joué un rôle important dans la sous-estimation du risque que représentait ce lancement sur au moins trois points :

  • différence notable d'appréciation de la fiabilité des lanceurs en règle générale entre les décideurs, les ingénieurs, et les valeurs statistiques réelles ;
  • surestimation de la fiabilité du joint par une interpolation linéaire non démontrée de cas antérieurs de fissure ;
  • surestimation de la clémence des conditions météorologiques de la Floride par les concepteurs : le tir fut effectué au petit matin, par −5 °C, ce qui n'y est pas une situation statistiquement rare, mais qui a été délaissée au profit de l'image d'Épinal d'un État réputé pour la douceur de son climat.

Voir aussi[modifier | modifier le code]

Notes et références[modifier | modifier le code]