回帰表の見方と解釈方法
統計学において、回帰は、予測変数と応答変数の間の関係を分析するために使用できる手法です。
ソフトウェア (R、SAS、SPSS など) を使用して回帰分析を実行すると、回帰結果を要約した回帰表を出力として受け取ります。回帰分析の結果を理解するには、この表の読み方を知ることが重要です。
このチュートリアルでは、回帰分析の例を示し、回帰表の結果を読み取って解釈する方法について詳しく説明します。
回帰の例
12 人の異なる学生の合計学習時間数、受けた予備試験の合計数、および最終試験の成績を示す次のデータ セットがあるとします。
学習時間と予備試験の受験時間と学生が取得した最終試験の成績との関係を分析するには、学習時間と予備試験の受験時間を予測変数として、試験中の最終成績を応答変数として使用して重線形回帰を実行します。
次の結果が得られます。
モデルの適合性の検討
最初のセクションでは、回帰モデルの適合性、つまり回帰モデルがデータセットにどれだけうまく「適合」できるかを測定するいくつかの異なる数値を示します。
このセクションの各数値を解釈する方法は次のとおりです。
いくつかのR
これが相関係数です。予測変数と応答変数の間の線形関係の強さを測定します。 R の倍数 1 は完全な線形関係を示し、R の倍数 0 は線形関係がないことを示します。倍数 R は、R の 2 乗の平方根です (下記を参照)。
この例では、倍数 R は 0.72855で、予測変数の学習時間と予備試験と応答変数の最終試験の成績との間にかなり強い線形関係があることを示しています。
R二乗
これは多くの場合r2と書かれ、決定係数としても知られています。これは、予測変数によって説明できる応答変数の分散の割合です。
R 二乗値の範囲は 0 ~ 1 です。値 0 は、応答変数が予測変数によってまったく説明できないことを示します。値 1 は、応答変数が予測変数によって誤差なく完全に説明できることを示します。
この例では、 R 二乗は 0.5307 で、最終試験のスコアの分散の 53.07% が学習時間数と過去の模擬試験の数によって説明できることを示しています。
調整済み R2 乗
これは、モデル内の予測子の数に基づいて調整された R 二乗の修正バージョンです。これは常に R の 2 乗より小さくなります。調整された R 二乗は、異なる回帰モデルの適合性を相互に比較するのに役立ちます。
この例では、調整された R 二乗は 0.4265 です。
回帰の標準誤差
回帰の標準誤差は、観測値と回帰直線の間の平均距離です。この例では、観測値は回帰直線から平均 7.3267 単位外れています。
関連:回帰の標準誤差を理解する
コメント
これは単にデータセット内の観測値の数です。この例では、観測値の合計数は 12 です。
回帰モデルの全体的な重要性をテストする
次のセクションでは、自由度、二乗和、二乗平均、F 統計量、および回帰モデルの全体的な有意性を示します。
このセクションの各数値を解釈する方法は次のとおりです。
回帰自由度
この数値は、回帰係数の数 – 1 に等しくなります。この例では、元の項と 2 つの予測子変数があるため、合計 3 つの回帰係数があり、回帰の自由度は 3 – 1 になります。 = 2 。
総自由度
この数値は、観測値の数 – 1 と等しくなります。この例では、観測値が 12 個あるため、自由度の合計は 12 – 1 = 11 となります。
残留自由度
この数値は、合計 df – 回帰 df と等しくなります。この例では、残りの自由度は11 – 2 = 9です。
平均二乗
回帰平均二乗は、SS 回帰/df 回帰によって計算されます。この例では、回帰 MS = 546.53308 / 2 = 273.2665 です。
残差平均二乗は、残差 SS/残差 df によって計算されます。この例では、残差 MS = 483.1335 / 9 = 53.68151 です。
F 統計
f 統計量は、MS 回帰/MS 残差として計算されます。この統計は、回帰モデルが独立変数を含まないモデルよりもデータによく適合するかどうかを示します。
基本的に、回帰モデル全体が有用かどうかをテストします。一般に、モデル内の予測変数が統計的に有意でない場合、全体の F 統計も統計的に有意ではありません。
この例では、 F 統計は 273.2665 / 53.68151 = 5.09 です。
F(P値)の重要性
表の最後の値は、F 統計量に関連付けられた p 値です。全体的な回帰モデルが有意かどうかを確認するには、p 値を有意水準と比較します。一般的な選択肢は .01、.05、および .10 です。
p 値が有意水準を下回っている場合は、回帰モデルが予測変数を使用しないモデルよりもデータによく適合すると結論付けるのに十分な証拠があります。この結果は、モデルの予測変数が実際にモデルの適合度を向上させることを意味するため、肯定的です。
この例では、 p 値は 0.033 であり、一般的な有意水準の 0.05 を下回っています。これは、回帰モデル全体が統計的に有意であること、つまり、モデルが予測変数を持たないモデルよりもデータによく適合していることを示しています。
回帰モデルの全体的な重要性をテストする
最後のセクションでは、回帰モデルの各項の係数推定値、推定値の標準誤差、t 統計量、p 値、および信頼区間が表示されます。
このセクションの各数値を解釈する方法は次のとおりです。
係数
係数は、推定された回帰式を書くために必要な数値を与えます。
yハット= b 0 + b 1 x 1 + b 2 x 2 。
この例では、推定される回帰式は次のようになります。
最終試験のスコア = 66.99 + 1.299 (学習時間) + 1.117 (予備試験)
個々の係数は、他のすべての予測変数が一定のままであると仮定して、特定の予測変数の 1 単位の増加ごとの応答変数の平均増加として解釈されます。たとえば、受験する予備試験の数が一定であると仮定すると、追加の 1 時間の学習ごとに、期末試験のスコアの予想平均スコアは 1,299 ポイント増加します。
切片は、ゼロ時間勉強し、予備試験を受けなかった生徒の最終試験の予想平均成績として解釈されます。この例では、学生は 0 時間勉強して予備試験を受けなかった場合、66.99 点を獲得すると予想されます。回帰結果の切片を解釈することが必ずしも意味があるとは限らないため、解釈するときは注意してください。
たとえば、場合によっては、切片が負の数であることが判明することがありますが、多くの場合、これには明確な解釈がありません。これはモデルが間違っているという意味ではなく、インターセプト自体に何らかの意味があると解釈すべきではないということだけを意味します。
標準誤差、t 統計量および p 値
標準誤差は、各変数の係数推定値に関する不確実性の尺度です。
t-stat は、単純に係数を標準誤差で割ったものです。たとえば、学習時間の t 統計は 1.299 / 0.417 = 3.117 です。
次の列は、t 統計に関連付けられた p 値を示します。この数値は、特定の応答変数がモデル内で重要であるかどうかを示します。この例では、学習時間の p 値は 0.012、予備試験の p 値は 0.304 であることがわかります。これは、模擬試験とは異なり、学習時間が最終試験の成績の重要な予測因子であることを示しています。
係数推定値の信頼区間
表の最後の 2 列は、係数推定値の 95% 信頼区間の下限と上限を示します。
たとえば、学習時間の係数推定値は 1.299 ですが、この推定値にはいくらか不確実性があります。これが正確な係数であるかどうかを確実に知ることはできません。したがって、95% 信頼区間により、真の係数として考えられる値の範囲が得られます。
この場合、学習時間の 95% 信頼区間は (0.356, 2.24) です。この信頼区間には数値「0」が含まれていないことに注意してください。これは、学習時間係数の真の値がゼロではない、つまり正の数であると完全に確信していることを意味します。
対照的に、予備試験の 95% 信頼区間は (-1.201, 3.436) です。この信頼区間には数値「0」が含まれていることに注意してください。これは、準備試験の係数の真の値がゼロになる可能性があること、つまり、最終試験の結果を予測する上で重要ではないことを意味します。