線形回帰の帰無仮説を理解する


線形回帰は、1 つ以上の予測変数と応答変数の間の関係を理解するために使用できる手法です。

予測変数と応答変数が 1 つだけの場合は、次の式を使用して変数間の関係を推定する単純線形回帰を使用できます。

ŷ = β 0 + β 1 x

金:

  • ŷ: 推定応答値。
  • β 0 : x が 0 のときの y の平均値。
  • β 1 : x の 1 単位の増加に伴う y の平均変化。
  • x: 予測変数の値。

単純な線形回帰では、次の帰無仮説と対立仮説が使用されます。

  • H 0 : β 1 = 0
  • H A : β 1 ≠ 0

帰無仮説は、係数 β 1がゼロに等しいと述べています。言い換えれば、予測変数 x と応答変数 y の間に統計的に有意な関係はありません。

対立仮説では、β 1はゼロに等しくないと述べています。言い換えれば、x と y の間には統計的に有意な関係があるということです

複数の予測変数と 1 つの応答変数がある場合は、次の式を使用して変数間の関係を推定する多重線形回帰を使用できます。

ŷ = β 0 + β 1 x 1 + β 2 x 2 + … + β k x k

金:

  • ŷ: 推定応答値。
  • β 0 : すべての予測変数がゼロに等しい場合の y の平均値。
  • β i : x iの 1 単位の増加に伴う y の平均変化。
  • x i : 予測子変数 x iの値。

多重線形回帰では、次の帰無仮説と対立仮説が使用されます。

  • H 0 : β 1 = β 2 = … = β k = 0
  • H A : β 1 = β 2 = … = β k ≠ 0

帰無仮説は、モデル内のすべての係数がゼロに等しいと述べています。言い換えれば、どの予測変数も応答変数 y と統計的に有意な関係を持ちません。

対立仮説は、すべての係数が同時にゼロに等しくなるわけではない、と述べています。

次の例は、単線形回帰モデルおよび重線形回帰モデルで帰無仮説を棄却するかどうかを決定する方法を示しています。

例 1: 単純な線形回帰

教授が、勉強時間数を使用して、クラスの生徒が到達するであろう試験の成績を予測したいとします。 20 人の学生からデータを収集し、単純な線形回帰モデルを当てはめます。

次のスクリーンショットは、回帰モデルの結果を示しています。

Excel での単純線形回帰出力

近似された単純線形回帰モデルは次のとおりです。

試験のスコア = 67.1617 + 5.2503*(勉強時間)

学習時間と試験スコアの間に統計的に有意な関係があるかどうかを判断するには、モデルの全体的な F 値と対応する p 値を分析する必要があります。

  • 全体のF値: 47.9952
  • P 値: 0.000

この p 値は 0.05 未満であるため、帰無仮説を棄却できます。言い換えれば、勉強時間と試験の得点の間には統計的に有意な関係があるということです。

例 2: 重回帰

教授が、学習時間数と受けた予備試験の数を使用して、学生が彼のクラスで獲得する成績を予測したいとします。 20 人の学生からデータを収集し、重線形回帰モデルに適合します。

次のスクリーンショットは、回帰モデルの結果を示しています。

Excel での重線形回帰出力

近似された重線形回帰モデルは次のとおりです。

試験スコア = 67.67 + 5.56*(勉強時間) – 0.60*(受験した予備試験)

2 つの予測変数と応答変数の間に統計的に有意な関係があるかどうかを判断するには、モデルの全体的な F 値と対応する p 値を分析する必要があります。

  • 全体のF値: 23.46
  • P 値: 0.00

この p 値は 0.05 未満であるため、帰無仮説を棄却できます。言い換えれば、勉強時間と予備試験の受験時間は試験結果と統計的に有意な関係があるということです。

注:受験した予備試験の p 値 (p = 0.52) は有意ではありませんが、予備試験と学習時間を組み合わせると、試験結果と有意な関係があります。

追加リソース

回帰における全体的な有意性に関する F 検定を理解する
回帰表の見方と解釈方法
回帰結果を報告する方法
Excelで単純な線形回帰を実行する方法
Excelで重回帰を実行する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です