Spss で多重共線性をテストする方法


回帰分析における 多重共線性は、2 つ以上の予測変数が相互に高度に相関しており、回帰モデル内で固有または独立した情報を提供しない場合に発生します。変数間の相関度が十分に高い場合、回帰モデルのフィッティングと解釈の際に問題が発生する可能性があります。

多重共線性を検出する 1 つの方法は、分散膨張係数 (VIF)として知られるメトリクスを使用することです。これは、回帰モデル内の予測子変数間の相関と相関の強さを測定します。

このチュートリアルでは、VIF を使用して SPSS の回帰分析で多重共線性を検出する方法について説明します。

例: SPSS の多重共線性

10 人の学生の試験の得点と、彼らが勉強に費やした時間数、受験した模擬試験の数、およびコースの現在の成績を示す次のデータセットがあるとします。

応答変数としてスコアを使用し、予測変数として時間prep_exams 、およびcurrent_gradeを使用して線形回帰を実行したいと考えていますが、3 つの予測変数に高度な相関関係がないことを確認したいと考えています。

多重共線性が問題であるかどうかを判断するには、各予測変数の VIF 値を生成します。

これを行うには、 [分析]タブ、 [回帰][線形] の順にクリックします。

表示される新しいウィンドウで、スコアを「依存」というラベルのボックスにドラッグし、3 つの予測子変数を「独立」というラベルのボックスにドラッグします。次に、 [統計]をクリックし、 [共線性診断] の横のボックスがオンになっていることを確認します。次に、 「続行」をクリックします。次に、 「OK」をクリックします。

[OK]をクリックすると、各予測子変数の VIF 値を示す次の表が表示されます。

SPSS の VIF

各予測変数の VIF 値は次のとおりです。

  • 時間: 1,169
  • 準備試験: 1,403
  • 現在のスコア: 1.522

VIF 値は 1 から始まり、上限はありません。 VIF を解釈するための一般的なルールは次のとおりです。

  • 値 1 は、モデル内の特定の予測子変数と他の予測子変数の間に相関がないことを示します。
  • 1 ~ 5 の値は、モデル内の特定の予測子変数と他の予測子変数の間に中程度の相関関係があることを示しますが、多くの場合、特別な注意を必要とするほど深刻ではありません。
  • 5 より大きい値は、モデル内の特定の予測子変数と他の予測子変数の間に重大な相関関係がある可能性があることを示します。この場合、回帰結果の係数推定値と p 値は信頼できない可能性があります。

この例では、予測子変数の VIF 値が 5 を超えていないことがわかり、回帰モデルでは多重共線性が問題にならないことがわかります。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です