0.05 を超える p 値を解釈する方法 (例付き)
検定仮説は、母集団パラメータに関する仮説が正しいかどうかを検定するために使用されます。
仮説検定を実行するときは常に、帰無仮説と対立仮説を定義します。
- 帰無仮説 (H 0 ):サンプル データは偶然のみから得られます。
- 対立仮説 ( HA ):サンプル データは非ランダム原因の影響を受けます。
仮説検定を実行するときは、使用する有意水準を指定する必要があります。
有意水準の一般的な選択肢は次のとおりです。
- α = 0.01
- α = 0.05
- α = 0.10
仮説検定の p 値が指定された有意水準より小さい場合、帰無仮説を棄却し、対立仮説が正しいと言える十分な証拠があると結論付けることができます。
p 値が指定された有意水準以上の場合、帰無仮説を棄却できず、対立仮説が正しいと言える十分な証拠がないと結論付けられます。
次の例では、実際に 0.05 を超える p 値を解釈する方法を説明します。
例 1: 0.05 を超える P 値の解釈 (生物学)
生物学者が、特定の肥料を使用すると、植物は 1 年間で通常よりも成長し、現在 20 インチ成長すると考えたとします。
これをテストするために、彼女は研究室の各植物に 3 か月間肥料を適用しました。
次に、次の仮説を使用して仮説検定を実行します。
帰無仮説 (H 0 ): μ = 20 インチ (肥料は植物の平均成長に影響を与えません)
対立仮説: ( HA ): μ > 20 インチ (肥料は植物の成長を平均的に増加させる)
α = 0.05 の有意水準を使用して平均に対する仮説を検定すると、生物学者は0.2338の p 値を受け取ります。
p 値0.2338は有意水準0.05より大きいため、生物学者は帰無仮説を棄却できません。
したがって、肥料が植物の成長を増加させると主張するには証拠が不十分であると彼女は結論付けています。
例 2: 0.05 より大きい P 値の解釈 (製造)
ある機械エンジニアは、新しい生産プロセスにより、特定の工場で製造される欠陥のあるウィジェットの数が減少すると考えています。現在、バッチごとに 3 つの欠陥のあるウィジェットが発生しています。
これをテストするために、新しいプロセスを使用してウィジェットの新しいバッチを作成します。
次に、次の仮定を使用して仮説検定を実行します。
帰無仮説 (H 0 ): μ = 3 (新しいプロセスは、バッチあたりの欠陥のあるウィジェットの平均数には影響しません)
対立仮説: ( HA ): μ < 3 (新しいプロセスにより、バッチあたりの欠陥のあるウィジェットの平均数が減少します)
エンジニアは、α = 0.05 の有意水準を使用して平均の仮説検定を実行し、p 値0.134を受け取ります。
p 値0.134は有意水準0.05より大きいため、エンジニアは帰無仮説を棄却できません。
したがって、新しいプロセスが各バッチで生成される欠陥のあるウィジェットの平均数の減少につながると主張するには証拠が不十分であると彼は結論付けています。
追加リソース
次のチュートリアルでは、p 値に関する追加情報を提供します。