Czynnik bayesa: definicja + interpretacja
Kiedy przeprowadzamy testowanie hipotez , zwykle otrzymujemy wartość p, którą porównujemy z pewnym poziomem alfa, aby zdecydować, czy powinniśmy odrzucić hipotezę zerową.
Na przykład możemy wykonać test t dla dwóch próbek, stosując poziom alfa równy 0,05, aby określić, czy średnie z dwóch populacji są równe. Załóżmy, że przeprowadzimy test i otrzymamy wartość p wynoszącą 0,0023. W tym przypadku odrzucilibyśmy hipotezę zerową, że średnie z dwóch populacji są równe, ponieważ wartość p jest mniejsza niż wybrany poziom alfa.
Wartości P są powszechnie stosowaną miarą służącą do odrzucenia lub nieodrzucenia pewnych hipotez, ale istnieje również inna miara, której można użyć: współczynnik Bayesa .
Czynnik Bayesa definiuje się jako stosunek prawdopodobieństwa danej hipotezy do prawdopodobieństwa innej hipotezy. Ogólnie rzecz biorąc, służy do znalezienia stosunku między prawdopodobieństwem hipotezy alternatywnej a prawdopodobieństwem hipotezy zerowej:
Współczynnik Bayesa = prawdopodobieństwo dostarczenia danych H A / prawdopodobieństwo dostarczenia danych H 0
Na przykład, jeśli współczynnik Bayesa wynosi 5, oznacza to, że biorąc pod uwagę dane, hipoteza alternatywna jest 5 razy bardziej prawdopodobna niż hipoteza zerowa.
I odwrotnie, jeśli współczynnik Bayesa wynosi 1/5, oznacza to, że hipoteza zerowa jest 5 razy bardziej prawdopodobna niż hipoteza alternatywna, biorąc pod uwagę dane.
Podobnie jak w przypadku wartości p, możemy użyć progów, aby zdecydować, kiedy odrzucić hipotezę zerową. Na przykład możemy zdecydować, że współczynnik Bayesa wynoszący 10 lub więcej stanowi wystarczająco mocny dowód, aby odrzucić hipotezę zerową.
Lee i Wagenmaker zaproponowali następujące interpretacje czynnika Bayesa w artykule z 2015 roku :
czynnik Bayesa | Interpretacja |
---|---|
> 100 | Skrajny dowód na alternatywną hipotezę |
30 – 100 | Bardzo mocny dowód na alternatywną hipotezę |
10 – 30 | Mocny dowód na alternatywną hipotezę |
3 – 10 | Umiarkowane dowody na alternatywną hipotezę |
1 – 3 | Anegdotyczny dowód na alternatywną hipotezę |
1 | Brak dowodów |
1/3 – 1 | Anegdotyczny dowód na hipotezę zerową |
1/3 – 1/10 | Umiarkowane dowody na hipotezę zerową |
1/10 – 1/30 | Mocne dowody na hipotezę zerową |
1/30 – 1/100 | Bardzo mocny dowód na hipotezę zerową |
<1/100 | Ekstremalne dowody na hipotezę zerową |
Czynniki Bayesa a wartości P
Współczynnik Bayesa i wartości p mają różne interpretacje.
Wartości P:
Wartość p interpretuje się jako prawdopodobieństwo uzyskania wyników tak ekstremalnych, jak zaobserwowane wyniki testu hipotezy, przy założeniu, że hipoteza zerowa jest poprawna.
Załóżmy na przykład, że przeprowadzasz test t dla dwóch próbek, aby ustalić, czy średnie z dwóch populacji są równe. Jeśli w wyniku testu wartość p wynosi 0,0023, oznacza to, że prawdopodobieństwo uzyskania tego wyniku wynosi tylko 0,0023 , jeśli średnie z obu populacji są rzeczywiście równe. Ponieważ wartość ta jest tak mała, odrzucamy hipotezę zerową i dochodzimy do wniosku, że mamy wystarczające dowody, aby stwierdzić, że średnie w obu populacjach nie są równe.
Współczynnik Bayesa:
Współczynnik Bayesa interpretuje się jako stosunek prawdopodobieństwa wystąpienia obserwowanych danych w przypadku hipotezy alternatywnej do prawdopodobieństwa wystąpienia zaobserwowanych danych w przypadku hipotezy zerowej.
Załóżmy na przykład, że przeprowadzasz test hipotezy i otrzymujesz współczynnik Bayesa równy 4. Oznacza to, że hipoteza alternatywna jest 4 razy bardziej prawdopodobna niż hipoteza zerowa, biorąc pod uwagę faktycznie zaobserwowane dane.
Wniosek
Niektórzy statystycy uważają, że współczynnik Bayesa ma przewagę nad wartościami p, ponieważ pomaga ilościowo określić dowody za i przeciw dwóch konkurujących hipotez. Na przykład dowody można określić ilościowo za lub przeciw hipotezie zerowej, czego nie można zrobić przy użyciu wartości p.
Niezależnie od tego, jakie podejście zastosujesz – współczynnik Bayesa czy wartości p – nadal musisz zdecydować o wartości progowej, czy chcesz odrzucić hipotezę zerową.
Na przykład w powyższej tabeli widzieliśmy, że współczynnik Bayesa wynoszący 9 zostanie sklasyfikowany jako „umiarkowany dowód na rzecz hipotezy alternatywnej”, podczas gdy współczynnik Bayesa wynoszący 10 zostanie sklasyfikowany jako „mocny dowód na rzecz hipotezy alternatywnej”.
W tym sensie współczynnik Bayesa boryka się z tym samym problemem: wartość p wynoszącą 0,06 uważa się za „nieistotną”, podczas gdy wartość p wynoszącą 0,05 można uznać za znaczącą.
Dalsza lektura:
Wyjaśnienie wartości P i istotności statystycznej
Proste wyjaśnienie znaczenia statystycznego i praktycznego