Probabilité de direction

Un article de Wikipédia, l'encyclopédie libre.

En statistiques bayésiennes, la probabilité de direction (pd) est un indice d'existence d'un effet correspondant à la certitude avec laquelle un effet est positif ou négatif[1]. Cet indice est numériquement similaire à la p-valeur fréquentiste[2],[3].

Définition[modifier | modifier le code]

Cet indice est mathématiquement défini comme la proportion de la distribution postérieure qui est du même signe que la médiane. Il varie généralement entre 50 et 100 %[4].

Histoire[modifier | modifier le code]

La formulation originale de cet indice et son utilisation en statistiques bayésiennes se trouvent dans la documentation du logiciel psycho sous l'appellation Maximum Probability of Effect (MPE)[5],[6]. Des formulations similaires ont également été décrites dans le contexte de l'interprétation des paramètres bootstrap.[réf. nécessaire]

Propriétés[modifier | modifier le code]

La probabilité de direction est en général indépendante du modèle statistique, car elle se base uniquement sur la distribution postérieure, et ne nécessite aucune information supplémentaire provenant des données ou du modèle. Contrairement aux indices liés à la Region of Practical Interest (ROPE), elle n'est pas sensible à l'échelle des variables dépendantes et indépendantes. Cependant, à l'instar de son homologue fréquentiste - la valeur-p, cet indice n'est pas en mesure de quantifier l'évidence en faveur de l'hypothèse nulle[2],[7]. Les avantages et les limites de la probabilité de direction ont été étudiés en la comparant à d'autres indices dont le Bayes Factor ou le test d'équivalence Bayesésien[2],[8],[4],[9].

Relation avec la valeur-p[modifier | modifier le code]

La probabilité de direction a une correspondance directe avec la valeur-p unilatérale à travers la formule et à la valeur-p bilatérale via la formule . Ainsi, une valeur-p bilatérale de respectivement .1, .05, .01 et .001 correspondrait approximativement à une pd de 95%, 97,5%, 99,5% et 99,95%[10]. La proximité entre la pd et la valeur-p est cohérente avec l'interprétation de cette première comme un indice d'existence d'effet, suivant ainsi la définition originale de la valeur-p[11],[12].

Interprétation[modifier | modifier le code]

Le package bayestestR pour le logiciel R suggère les règles d'interprétation suivantes[13] :

pd p-value equivalence Interpretation
Uncertain
Existence possible
Existence plausible
Existence probable
Existence certaine

Références[modifier | modifier le code]

  1. Makowski, Ben-Shachar et Lüdecke, « bayestestR: Describing Effects and their Uncertainty, Existence and Significance within the Bayesian Framework », Journal of Open Source Software, vol. 4, no 40,‎ , p. 1541 (DOI 10.21105/joss.01541, Bibcode 2019JOSS....4.1541M)
  2. a b et c Makowski, Ben-Shachar, Chen et Lüdecke, « Indices of Effect Existence and Significance in the Bayesian Framework », Frontiers in Psychology, vol. 10,‎ , p. 2767 (PMID 31920819, PMCID 6914840, DOI 10.3389/fpsyg.2019.02767)
  3. (en-US) Heiss, « Bayesian statistics resources », Georgia State University - Bayesian statistics course (consulté le )
  4. a et b Kelter, « Analysis of Bayesian posterior significance and effect size indices for the two-sample t-test to support reproducible medical research », BMC Medical Research Methodology, vol. 20, no 1,‎ , p. 88 (PMID 32321438, PMCID 7178740, DOI 10.1186/s12874-020-00968-2)
  5. Makowski, « The psycho Package: an Efficient and Publishing-Oriented Workflow for Psychological Science », The Journal of Open Source Software, vol. 3, no 22,‎ , p. 470 (DOI 10.21105/joss.00470, Bibcode 2018JOSS....3..470M)
  6. Makowski, « psycho - The Bayesian Framework », cran.r-hub.io (consulté le )
  7. Kelter, « How to Choose between Different Bayesian Posterior Indices for Hypothesis Testing in Practice », Multivariate Behavioral Research,‎ , p. 1–29 (PMID 34582284, DOI 10.1080/00273171.2021.1967716, arXiv 2005.13181)
  8. Baig, « Bayesian Inference: Parameter Estimation for Inference in Small Samples », Nicotine & Tobacco Research,‎ , ntab221 (PMID 34679175, DOI 10.1093/ntr/ntab221)
  9. Kelter, « Bayesian and frequentist testing for differences between two groups with parametric and nonparametric two-sample tests », WIREs Computational Statistics, vol. 13, no 6,‎ , e1523 (DOI 10.1002/wics.1523)
  10. (en) « BayestestR - Probability of Direction », https://easystats.github.io/bayestestR (consulté le )
  11. R. A. Fisher, Statistical methods for research workers (11th ed. rev.), Edinburgh, Oliver and Boyd,
  12. Cohen, « The earth is round (p < .05). », American Psychologist, vol. 49, no 12,‎ , p. 997–1003 (DOI 10.1037/0003-066X.49.12.997)
  13. (en) « Bayesian Reporting Guidelines », https://easystats.github.io/bayestestR (consulté le )