P 値とアルファ: 違いは何ですか?
学生が統計学でよく混同する 2 つの用語は、 p 値とalphaです。
どちらの用語も仮説検定で使用されます。仮説検定は、仮説を棄却するか棄却できなかったかに使用する正式な統計検定です。
たとえば、新しい錠剤が現在の標準的な錠剤よりも患者の血圧を下げるという仮説を立てたとします。
これをテストするために、次の帰無仮説と対立仮説を定義する仮説検定を実行できます。
帰無仮説:新しい錠剤と標準的な錠剤の間に違いはありません。
代替仮説:新しい錠剤と標準的な錠剤には違いがあります。
帰無仮説が正しいと仮定すると、検定のp 値は、サンプル データで実際に観察された効果と少なくとも同じくらい大きな効果が得られる確率を示します。
たとえば、仮説検定の p 値が 0.02 であることが判明したとします。
この p 値を解釈する方法は次のとおりです。新しい錠剤と標準の錠剤の間に本当に差がなかった場合、この仮説検定を実行する回数の 2% 以上で、サンプル データで観察された効果が得られます。単にランダムなサンプリング誤差が原因です。
これは、新しい錠剤と標準の錠剤の間に実際に違いがない場合、実際にデータサンプルを取得することはかなりまれであることを示しています。
したがって、私たちは帰無仮説を棄却し、新しい錠剤と標準的な錠剤には違いがあると結論付ける傾向があります。
しかし、p 値が帰無仮説を棄却するのに十分低いかどうかを判断するには、どのしきい値を使用すればよいでしょうか?
ここでアルファの出番です!
アルファレベル
仮説検定のアルファレベルは、p 値が帰無仮説を棄却するのに十分低いかどうかを判断するために使用するしきい値です。 0.05 に設定されることが多いですが、0.01 または 0.10 に設定される場合もあります。
たとえば、仮説検定のアルファ レベルを 0.05 に設定し、p 値 0.02 が得られた場合、p 値はアルファ レベルより小さいため、帰無仮説は棄却されます。したがって、対立仮説が正しいと言える十分な証拠があると結論付けることができます。
アルファ レベルは真の帰無仮説を誤って棄却する確率も定義することに注意することが重要です。
たとえば、新しい錠剤と現在の錠剤の間で血圧の平均低下に差があるかどうかをテストしたいとします。そして、2 つの錠剤の間に違いがないと仮定しましょう。
仮説検定のアルファ レベルを 0.05 に設定すると、仮説検定プロセスを数回繰り返した場合、ケースの約 5% で帰無仮説が誤って棄却されることが予想されることを意味します。テスト。
アルファレベルの選択方法
前述したように、仮説検定のアルファ レベルとして最も一般的に選択されるのは 0.05 です。ただし、誤った結論が重大な結果につながる状況では、アルファ レベルをさらに低く、おそらく 0.01 に設定できます。
たとえば、医療分野では、研究者が仮説検定の結果の信頼性を確認したいため、アルファ レベルを 0.01 に設定するのが一般的です。
逆に、マーケティングなどの分野では、間違いを犯した場合の結果は生死に関わるものではないため、アルファ レベルを 0.10 などの高い値に設定することが一般的かもしれません。
検定のアルファレベルを上げると、有意な検定結果が見つかる可能性が高くなりますが、真の帰無仮説が誤って棄却される可能性も高くなります。
まとめ:
この記事で学んだことは次のとおりです。
1. p 値は、サンプル データで実際に観察された効果と少なくとも同じくらい大きな効果が得られる確率を示します。
2.アルファ レベルは、真の帰無仮説を誤って棄却する確率です。
3.仮説検定の p 値がアルファレベルより小さい場合、帰無仮説を棄却できます。
4.検定のアルファ レベルを上げると、有意な検定結果が見つかる可能性が高くなりますが、真の帰無仮説が誤って棄却される可能性も高くなります。