ベイズ因子: 定義 + 解釈
仮説検定を実行すると、通常、最終的に p 値が得られ、それをアルファ レベルと比較して、帰無仮説を棄却すべきかどうかを決定します。
たとえば、アルファ レベル 0.05 を使用して2 サンプルの t 検定を実行し、2 つの母集団の平均が等しいかどうかを判断できます。検定を実行し、p 値 0.0023 が得られたとします。この場合、p 値が選択したアルファ レベルより小さいため、2 つの母集団の平均が等しいという帰無仮説は棄却されます。
P 値は、特定の仮説を棄却するか棄却できなかったかを判断するためによく使用される尺度ですが、ベイズ係数という別の尺度も使用できます。
ベイズ係数は、特定の仮説の確率と別の仮説の確率の比として定義されます。一般に、対立仮説の確率と帰無仮説の確率の比を求めるために使用されます。
ベイズ係数 =データが提供される確率 H A / データが提供される確率 H 0
たとえば、ベイズ係数が 5 の場合、データを考慮すると、対立仮説の可能性が帰無仮説の 5 倍であることを意味します。
逆に、ベイズ係数が 1/5 の場合、データが与えられた場合、帰無仮説の可能性が対立仮説の 5 倍であることを意味します。
p 値と同様に、閾値を使用して帰無仮説をいつ棄却するかを決定できます。たとえば、10 以上のベイズ係数が帰無仮説を棄却するのに十分な強力な証拠であると判断する場合があります。
Lee と Wagenmaker は、 2015 年の論文でベイズ因子の次の解釈を提案しました。
ベイズ因子 | 解釈 |
---|---|
> 100 | 対立仮説の極端な証拠 |
30~100 | 対立仮説に対する非常に強力な証拠 |
10~30 | 対立仮説の強力な証拠 |
3~10 | 対立仮説に対する中程度の証拠 |
1~3 | 対立仮説の事例証拠 |
1 | 証拠がない |
1/3~1 | 帰無仮説の事例証拠 |
1/3~1/10 | 帰無仮説に対する中程度の証拠 |
1/10~1/30 | 帰無仮説の強力な証拠 |
1/30~1/100 | 帰無仮説に対する非常に強力な証拠 |
<1/100 | 帰無仮説の極端な証拠 |
ベイズ係数と P 値の関係
ベイズ因子と p 値には異なる解釈があります。
P 値:
p 値は、帰無仮説が正しいと仮定した場合、仮説検定の観察結果と同じくらい極端な結果が得られる確率として解釈されます。
たとえば、2 つの標本の t 検定を実行して、2 つの母集団の平均が等しいかどうかを判断するとします。検定の結果 p 値が 0.0023 となった場合、2 つの母集団の平均が真に等しい場合、この結果が得られる確率はわずか0.0023であることを意味します。この値は非常に小さいため、帰無仮説は棄却され、2 つの母集団の平均が等しくないと言える十分な証拠があると結論付けられます。
ベイズ係数:
ベイズ係数は、帰無仮説の下で発生する観察データの確率に対する、対立仮説の下で発生する観察データの確率の比として解釈されます。
たとえば、仮説検定を実行し、ベイズ係数 4 が得られたとします。これは、実際に観察したデータを考慮すると、対立仮説の可能性が帰無仮説の 4 倍であることを意味します。
結論
一部の統計学者は、ベイズ係数は 2 つの競合する仮説の賛否の証拠を定量化するのに役立つため、p 値よりも利点があると信じています。たとえば、証拠は帰無仮説の賛否を定量化できますが、これは p 値を使用して行うことはできません。
ベイズ因子または p 値のどちらのアプローチを使用するかに関係なく、帰無仮説を棄却するかどうかにかかわらず、しきい値を決定する必要があります。
たとえば、上の表では、ベイズ係数 9 は「対立仮説に対する中程度の証拠」として分類され、ベイズ係数 10 は「対立仮説に対する強力な証拠」として分類されることがわかりました。
この意味で、ベイズ因子も同じ問題に悩まされています。p 値 0.06 は「有意ではない」とみなされますが、p 値 0.05 は有意であるとみなされる可能性があります。
参考文献: