Czynnik Bayesa

Czynnik Bayesa (BF, ang. Bayes factor) – stosunek prawdopodobieństwa uzyskania danych obserwacji w dwóch porównywanych modelach. Pozwala on na porównanie, w jakim stopniu dane świadczą na rzecz dwóch alternatywnych hipotez, i jest jedną z metod weryfikowania hipotez statystycznych we wnioskowaniu bayesowskim[1][2].

Definicja

Zakładając, że porównujemy dwa modele M 1 {\displaystyle M_{1}} i M 2 {\displaystyle M_{2}} (wraz z wektorami parametrów θ 1 {\displaystyle \theta _{1}} i θ 2 {\displaystyle \theta _{2}} ) w oparciu o zbiór obserwacji D , {\displaystyle D,} ich prawdopodobieństwo można porównać przy użyciu czynniku Bayesa K : {\displaystyle K{:}}

K = Pr ( D | M 1 ) Pr ( D | M 2 ) = Pr ( θ 1 | M 1 ) Pr ( D | θ 1 , M 1 ) d θ 1 Pr ( θ 2 | M 2 ) Pr ( D | θ 2 , M 2 ) d θ 2 . {\displaystyle K={\frac {\Pr(D|M_{1})}{\Pr(D|M_{2})}}={\frac {\int \Pr(\theta _{1}|M_{1})\Pr(D|\theta _{1},M_{1})\,d\theta _{1}}{\int \Pr(\theta _{2}|M_{2})\Pr(D|\theta _{2},M_{2})\,d\theta _{2}}}.}

Spotyka się też notację BF10 i BF01, odpowiadające czynnikom Bayesa testującym, odpowiednio, hipotezę alternatywną H1, lub hipotezę zerową H0, przeciwko sobie nawzajem, analogicznie do procedury częstościowej weryfikacji hipotez statystycznych.

Interpretacja

Wartości K > 1 {\displaystyle K>1} świadczą na rzecz hipotezy M 1 , {\displaystyle M_{1},} wartości K < 1 {\displaystyle K<1} świadczą na rzecz hipotezy M 2 . {\displaystyle M_{2}.} Dla porównania, w podejściu częstościowym, testowana jest jedynie hipoteza zerowa, a o prawdziwości hipotezy alternatywnej można wnioskować jedynie pośrednio. Dwie popularne skale interpretacyjne dla wartości K {\displaystyle K} stworzyli Harold Jeffreys, oraz Hass i Raftery[3][4]:

K (Jeffreys) K (Hass i Raftery) Siła dowodowa
< 1
< 1
negatywna (wspiera M2)
od 1 do 101/2 (≈3,16)
od 1 do 3
warta co najwyżej wzmianki
od 101/2 (≈3,16) do 10
od 3 do 20
znaczna
od 10 do 103/2 (≈31,62)
od 20 do 150
silna
od 103/2 (≈31,62) do 100
> 150
bardzo silna
>100 rozstrzygająca

Czynnik Bayesa jest adekwatny do zastosowań epistemologicznych – gdy badacz chce określić relatywne, subiektywne prawdopodobieństwo hipotezy. Do celów podejmowania decyzji służą inne narzędzia, uwzględniające koszt popełnienia błędów, takie jak metody statystyki częstościowej, lub metody bayesowskie z funkcjami strat.

Wartość czynnika Bayesa porównującego hipotezę zerową z hipotezą alternatywną jest w znacznym stopniu współzmienna z odpowiadającą mu P-wartością. Jego przewagą jest w tym przypadku dokładniejsze rozstrzyganie wartości dowodowej wyników, które są bliskie krytycznego poziomu istotności[5]. Przy wysokiej mocy statystycznej badania, mogą być bardziej prawdopodobne dla hipotezy zerowej, jednak w procedurze wnioskowania częstościowego są uznawane za przesłankę na rzecz hipotezy alternatywnej[6]. Czynnik Bayesa pozwala też na łatwe wykonywanie innych porównań, np. minimalnej istotnej klinicznie różnicy.

Przypisy

  1. Michael E.J.M.E.J. Masson Michael E.J.M.E.J., A tutorial on a practical Bayesian alternative to null-hypothesis significance testing, „Behavior Research Methods”, 43 (3), 2011, s. 679–690, DOI: 10.3758/s13428-010-0049-5, ISSN 1554-3528 [dostęp 2017-01-13]  (ang.).
  2. Andrew F.A.F. Jarosz Andrew F.A.F., JenniferJ. Wiley JenniferJ., What Are the Odds? A Practical Guide to Computing and Reporting Bayes Factors, „The Journal of Problem Solving”, 7 (1), 2014, DOI: 10.7771/1932-6246.1167, ISSN 1932-6246 [dostęp 2017-01-13] .
  3. HaroldH. Jeffreys HaroldH., The Theory of Probability, OUP Oxford, 6 sierpnia 1998, s. 432, ISBN 978-0-19-158967-6 [dostęp 2017-01-13]  (ang.).
  4. Robert E.R.E. Kass Robert E.R.E., Adrian E.A.E. Raftery Adrian E.A.E., Bayes Factors, „Journal of the American Statistical Association”, 90 (430), 1995, s. 773–795, DOI: 10.1080/01621459.1995.10476572, ISSN 0162-1459 [dostęp 2017-01-13] .
  5. RuudR. Wetzels RuudR. i inni, Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests, „Perspectives on Psychological Science: A Journal of the Association for Psychological Science”, 6 (3), 2011, s. 291–298, DOI: 10.1177/1745691611406923, ISSN 1745-6916, PMID: 26168519 [dostęp 2017-01-15] .
  6. DaniëlD. Lakens DaniëlD., On the challenges of drawing conclusions fromp-values just below 0.05, „PeerJ”, 3, 2015, DOI: 10.7717/peerj.1142, ISSN 2167-8359, PMID: 26246976, PMCID: PMC4525697 [dostęp 2017-01-15]  (ang.).