Excel での回帰出力を解釈する方法
重線形回帰は、すべての統計において最も一般的に使用される手法の 1 つです。
このチュートリアルでは、Excel で重線形回帰モデルの出力の各値を解釈する方法について説明します。
例: Excel での回帰出力の解釈
勉強に費やした時間数と予備試験の受験数が、学生が特定の大学入学試験で取得する成績に影響するかどうかを知りたいとします。
この関係を調べるために、学習時間と受けた予備試験を予測変数として、試験のスコアを応答変数として使用して重線形回帰を実行できます。
次のスクリーンショットは、Excel でのこのモデルの回帰出力を示しています。
出力内の最大値を解釈する方法は次のとおりです。
複数の R: 0.857 。これは、応答変数と 2 つの予測変数間の多重相関を表します。
R スクエア: 0.734 。これを決定係数といいます。説明変数によって説明できる応答変数の分散の割合です。この例では、試験得点の変動の 73.4% は、勉強時間数と受験した予備試験の数によって説明されます。
調整後の R 平方: 0.703 。これは、モデル内の予測子変数の数に合わせて調整されたR 二乗値を表します。この値も R 二乗値よりも低くなり、モデル内で使用する予測子変数が多すぎるモデルにペナルティが課されます。
標準誤差: 5.366 。これは、観測値と回帰直線の間の平均距離です。この例では、観測値は回帰直線から平均して 5,366 単位外れています。
コメント: 20 。回帰モデルの作成に使用されるデータセットの合計サンプル サイズ。
F: 午後 11:46これは回帰モデルの全体的な F 統計量であり、回帰 MS/残差 MS として計算されます。
意味 F: 0.0000 。これは、全体的な F 統計量に関連付けられた p 値です。これにより、回帰モデル全体が統計的に有意であるかどうかがわかります。
この場合、p 値は 0.05 未満であり、説明変数である学習時間と受けた予備試験の合計が試験結果と統計的に有意な関連性があることを示しています。
係数:各説明変数の係数は、他の説明変数が一定のままであると仮定した場合、応答変数の予想される平均変化を示します。
たとえば、受験した模擬試験が一定であると仮定すると、勉強に費やす時間がさらに 1 時間増えるごとに、試験の平均得点は5.56 点増加すると予想されます。
切片係数は、何時間も勉強せず、予備試験も受けなかった生徒の予想される試験スコアが67.67であることを意味すると解釈します。
P 値。個々の p 値は、各説明変数が統計的に有意であるかどうかを示します。学習時間は統計的に有意 (p = 0.00) ですが、予備試験の受験時間(p = 0.52) は α = 0.05 で統計的に有意ではないことがわかります。
推定回帰式の書き方
モデル出力の係数を使用して、次の推定回帰式を作成できます。
試験スコア = 67.67 + 5.56*(時間数) – 0.60*(予備試験)
この推定回帰式を使用して、学習時間数と受験した模擬試験の数に基づいて、生徒の予想される試験スコアを計算できます。
たとえば、3 時間勉強して予備試験を受ける学生は、 83.75の成績を取得する必要があります。
試験のスコア = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
過去の予備試験は統計的に有意ではなかったので (p=0.52)、モデル全体に何の改善ももたらさないため、試験を削除することを決定する場合があることに注意してください。
この場合、説明変数として調査時間のみを使用して単純な線形回帰を実行できます。