Spss에서 다중 공선성을 테스트하는 방법


회귀 분석의 다중 공선성은 둘 이상의 예측 변수가 서로 높은 상관 관계를 갖고 있어 회귀 모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다.

다중 공선성을 탐지하는 한 가지 방법은 회귀 모델에서 예측 변수 간의 상관 관계 및 상관 강도를 측정하는 분산 팽창 계수(VIF) 라는 측정항목을 사용하는 것입니다.

이 튜토리얼에서는 VIF를 사용하여 SPSS 회귀 분석에서 다중 공선성을 탐지하는 방법을 설명합니다.

예: SPSS의 다중 공선성

10명의 학생의 시험 점수와 함께 공부한 시간, 응시한 연습 시험 횟수, 해당 과정의 현재 성적을 보여주는 다음 데이터세트가 있다고 가정합니다.

우리는 점수를 응답 변수로 사용하고 시간 , prep_examscurrent_grade를 예측 변수로 사용하여 선형 회귀를 수행하고 싶지만 세 가지 예측 변수가 높은 상관 관계가 없는지 확인하고 싶습니다.

다중 공선성이 문제인지 확인하기 위해 각 예측 변수에 대한 VIF 값을 생성할 수 있습니다.

이렇게 하려면 분석 탭을 클릭한 다음 회귀 , 선형을 차례로 클릭합니다.

나타나는 새 창에서 점수를 종속성 상자로 끌어서 놓고 3개의 예측 변수를 독립성 상자로 끌어옵니다. 그런 다음 통계를 클릭하고 공선성 진단 옆의 확인란이 선택되어 있는지 확인하세요. 그런 다음 계속 을 클릭합니다. 그런 다음 확인을 클릭합니다.

확인 을 클릭하면 각 예측 변수에 대한 VIF 값을 보여주는 다음 표가 나타납니다.

SPSS의 VIF

각 예측변수에 대한 VIF 값은 다음과 같습니다.

  • 시간: 1,169
  • 준비_시험: 1,403
  • 현재_점수: 1.522

VIF 값은 1부터 시작하며 상한이 없습니다. VIF를 해석하는 일반적인 규칙은 다음과 같습니다.

  • 값 1은 주어진 예측 변수와 모델의 다른 예측 변수 사이에 상관 관계가 없음을 나타냅니다.
  • 1과 5 사이의 값은 주어진 예측 변수와 모델의 다른 예측 변수 사이의 중간 정도의 상관 관계를 나타내지만 특별한 주의가 필요할 만큼 심각하지는 않은 경우가 많습니다.
  • 5보다 큰 값은 주어진 예측 변수와 모델의 다른 예측 변수 사이에 잠재적으로 심각한 상관 관계가 있음을 나타냅니다. 이 경우 회귀 결과의 계수 추정치와 p-값은 신뢰할 수 없을 가능성이 높습니다.

이 예에서 예측 변수에 대한 VIF 값 중 어느 것도 5보다 크지 않음을 알 수 있는데, 이는 다중 공선성이 회귀 모델에서 문제가 되지 않음을 나타냅니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다