Oubli de la fréquence de base

L'oubli de la fréquence de base (aussi connue sous le nom de négligence de la taille de l'échantillon) est un biais cognitif lié aux lois statistiques, qui se manifeste par le fait que les gens oublient souvent de considérer la fréquence de base de l'occurrence d'un événement lorsqu'ils cherchent à en évaluer une probabilité. Le plus souvent, cela conduit à surestimer cette probabilité.

Historique[modifier | modifier le code]

Dans les années 1970, les psychologues et économistes Daniel Kahneman et Amos Tversky ont mené une série d'expériences mettant en évidence les erreurs dues à l'oubli de la fréquence de base, courantes même dans des populations de sujets hautement diplômés.

Exemples didactiques[modifier | modifier le code]

Caméras de surveillance[modifier | modifier le code]

Soit une ville d'un million individus présents sur son territoire. Sur ce million (1 000 000) d'individus, 100 sont des délinquants présumés et répertoriés comme tels sur une liste, les 999 900 autres étant présumés non-délinquants. Afin de détecter la présence d'un délinquant sur son territoire, la ville installe des caméras de vidéosurveillance avec un dispositif de reconnaissance faciale automatique : celui-ci doit déclencher une alerte dès lors que le visage filmé est celui d'un des 100 délinquants de la liste. Malheureusement, le dispositif de reconnaissance faciale n'est pas parfait. Supposons qu'il ait un « taux d'erreur de 1 % », ou, plus précisément, que :

sa sensibilité soit de 99 %, soit un taux de 1 % de faux négatifs parmi les vrais délinquants ;
sa spécificité soit de 99 %, soit un taux de 1 % de faux positifs parmi les non-délinquants.

Lorsqu'une alerte se déclenche, quelle est la probabilité que l'on soit en présence d'un délinquant répertorié sur la liste ?

Si l'on raisonne avec « oubli de la fréquence de base », c'est-à-dire en ne retenant que le « taux d'erreur est de 1 % », on répond un peu rapidement qu'il y a 99 % de probabilité que l'individu soit effectivement un délinquant lorsqu'une alerte est déclenchée. Ce qui est erroné. En effet, lorsqu'on comptabilise l'ensemble des alertes, deux situations sont à prendre en compte simultanément :

99 % des délinquants déclenchent l'alerte, soit 99 délinquants sur les 100 de la liste (selon la définition de la sensibilité) ;
1 % des non-délinquants déclenchent l'alerte, soit 9 999 non-délinquants sur 999 900 (selon la définition de la spécificité).

Soit un total de 99 + 9999 = 10 098 alertes. Lorsqu'une alerte se déclenche, la probabilité que l'individu soit effectivement un délinquant est donc de 99 sur 10 098, soit 0,98 % et non de 99 %^[1]. Cette probabilité peut être retrouvée par le théorème de Bayes.

Vaccination[modifier | modifier le code]

Soit une population vaccinée à 95 % contre un virus. Le vaccin, bien qu'imparfaitement efficace, est supposé très efficace contre toute forme symptomatique de la maladie. Durant la pandémie, on enregistre le nombre de non-vaccinés et de vaccinés parmi les malades testés positifs, pour déterminer l'impact de la vaccination sur la réponse immunitaire obtenue contre la maladie.

Intuitivement, un nombre élevé de vaccinés parmi les malades pourrait laisser penser que le vaccin est en fin de compte très peu efficace contre la maladie. Mais cette intuition est biaisée : on ne peut pas comparer des nombres de cas sur des populations de tailles différentes ; s'il y a beaucoup de vaccinés parmi les malades c'est simplement dû au fait que la population de base des vaccinés est très grande.

Dans l'hypothèse d'un vaccin efficace à 95 % contre la maladie et d'une couverture vaccinale de 96 % de la population :

parmi les vaccinés (96 % de la population), 5 % (du fait des 95 % d'efficacité du vaccin) risquent de contracter une forme de la maladie contre laquelle ils n'auront aucune réponse immunitaire apprise, soit 4,8 % de la population totale ;
parmi les non-vaccinés (4 % de la population), 100 % risquent de contracter une forme de la maladie contre laquelle ils n'auront aucune réponse immunitaire apprise, soit 4 % de la population.

Avec un vaccin efficace à 95 % et une couverture vaccinale de 96 %, il y a une probabilité que le nombre de vaccinés malades soit plus élevé que le nombre de non-vaccinés malades^[2]^,^[3]^,^[4].

En poussant à l’extrême ce cas de figure, dans la situation où la totalité de la population est vaccinée avec un vaccin efficace à 95%, la totalité des malades hospitalisés est constituée de personnes vaccinées.

Voir aussi[modifier | modifier le code]

Notes et références[modifier | modifier le code]

↑ Timme Bisgaard Munk, « 100,000 false positives for every real terrorist: Why anti-terror algorithms don't work », First Monday, vol. 22, n^o 9,‎ 1^er septembre 2017 (DOI 10.5210/fm.v22i9.7126, lire en ligne)
↑ SPI-M-O: Summary of further modelling of easing restrictions – Roadmap Step 2, 31 March 2021, Scientific Advisory Group for Emergencies, page 18 ["This is not the result of vaccines being ineffective, merely uptake being so high."]
↑ « Covid-19 : pourquoi y a-t-il désormais plus de vaccinés que de non-vaccinés admis à l’hôpital ? », sur Le Parisien, 18 novembre 2021.
↑ « Covid-19 : les vaccinés sont-ils plus souvent hospitalisés que les non-vaccinés ? », sur Sciences et avenir, 24 novembre 2021.

[Munk-1] Timme Bisgaard Munk, « 100,000 false positives for every real terrorist: Why anti-terror algorithms don't work », First Monday, vol. 22, n^o 9,‎ 1^er septembre 2017 (DOI 10.5210/fm.v22i9.7126, lire en ligne)

[2] SPI-M-O: Summary of further modelling of easing restrictions – Roadmap Step 2, 31 March 2021, Scientific Advisory Group for Emergencies, page 18 ["This is not the result of vaccines being ineffective, merely uptake being so high."]

[3] « Covid-19 : pourquoi y a-t-il désormais plus de vaccinés que de non-vaccinés admis à l’hôpital ? », sur Le Parisien, 18 novembre 2021.

[4] « Covid-19 : les vaccinés sont-ils plus souvent hospitalisés que les non-vaccinés ? », sur Sciences et avenir, 24 novembre 2021.

[1]

[2]

[3]

[4]

v · m Sophismes
Sophisme a priori	Appel à la flatterie à l'ignorance à la nature au ridicule à la terreur Argument d'autorité Argumentum ad antiquitatem ad baculum ad crumenam ad lazarum ad novitatem ad odium Double faute Erreur du parieur Paralogisme naturaliste
Sophisme d'observation	Argumentum a silentio Argumentum ad nauseam Aucun vrai Écossais Fausse équivalence Post hoc ergo propter hoc
Sophisme de généralisation	Cause unique Conséquent Disjonction Échantillon biaisé Faux dilemme Faux équilibre Juste milieu McNamara Oubli de la fréquence de base Pente savonneuse Solution parfaite Sophisme de composition
Sophisme par confusion	Amphibologie Appel à Galilée Cum hoc ergo propter hoc Épouvantail Fausse objection Faux dilemme Inversion de la charge de la preuve Pétition de principe Plurium interrogationum Question piège Sophisme par association Sophisme de la motte castrale Whataboutism
Par nom latin	Argumentum a silentio ad antiquitatem ad baculum ad crumenam ad hominem ad lazarum ad misericordiam ad naturam ad nauseam ad novitatem ad odium ad personam ad populum ad verecundiam Ignoratio elenchi Non causa pro causa Non sequitur Plurium interrogationum Post hoc ergo propter hoc Reductio ad Hitlerum Reductio ad Stalinum

v · m Biais cognitifs
Biais mnésique	Effet de récence Effet de simple exposition Oubli de la fréquence de base Effet de primauté
Biais de jugement	Effet d'ambiguïté Ancrage mental Préjugé Biais d'attribution Biais d'autocomplaisance Biais de négativité Pensée désidérative Biais du statu quo Biais égocentrique Biais rétrospectif Effet de halo Effet de projecteur Effet de simple exposition Effet râteau Effet Dunning-Kruger Erreur fondamentale d'attribution Biais d'impact Illusion de savoir Effet Ikea Loi de l'instrument Aversion à la dépossession Aversion pour la perte Aversion pour l'incertitude Biais de confirmation Croyance en un monde juste Illusion monétaire Biais de la tache aveugle Biais de normalité
Biais de raisonnement	Erreur de conjonction Biais de disponibilité Biais d'appariement Biais des survivants Cadrage Réduction de la dissonance cognitive Effet rebond Illusion des séries Perception sélective Réification du savoir Effet de domination asymétrique Coût irrécupérable Biais de participation
Biais liés à la personnalité	Biais culturel Biais linguistique Biais d'optimisme Biais de pessimisme Conformisme Effet boomerang Effet Barnum
Autres	Illusion Paralogisme Sophisme Atténuation Débiaisement