Spss에서 다중 공선성을 테스트하는 방법

에 의해 벤자민 앤더슨 7월 28, 2023 가이드 댓글 0개

회귀 분석의 다중 공선성은 둘 이상의 예측 변수가 서로 높은 상관 관계를 갖고 있어 회귀 모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다.

다중 공선성을 탐지하는 한 가지 방법은 회귀 모델에서 예측 변수 간의 상관 관계 및 상관 강도를 측정하는 분산 팽창 계수(VIF) 라는 측정항목을 사용하는 것입니다.

이 튜토리얼에서는 VIF를 사용하여 SPSS 회귀 분석에서 다중 공선성을 탐지하는 방법을 설명합니다.

예: SPSS의 다중 공선성

10명의 학생의 시험 점수와 함께 공부한 시간, 응시한 연습 시험 횟수, 해당 과정의 현재 성적을 보여주는 다음 데이터세트가 있다고 가정합니다.

우리는 점수를 응답 변수로 사용하고 시간 , prep_exams 및 current_grade를 예측 변수로 사용하여 선형 회귀를 수행하고 싶지만 세 가지 예측 변수가 높은 상관 관계가 없는지 확인하고 싶습니다.

다중 공선성이 문제인지 확인하기 위해 각 예측 변수에 대한 VIF 값을 생성할 수 있습니다.

이렇게 하려면 분석 탭을 클릭한 다음 회귀 , 선형을 차례로 클릭합니다.

나타나는 새 창에서 점수를 종속성 상자로 끌어서 놓고 3개의 예측 변수를 독립성 상자로 끌어옵니다. 그런 다음 통계를 클릭하고 공선성 진단 옆의 확인란이 선택되어 있는지 확인하세요. 그런 다음 계속 을 클릭합니다. 그런 다음 확인을 클릭합니다.

확인 을 클릭하면 각 예측 변수에 대한 VIF 값을 보여주는 다음 표가 나타납니다.

SPSS의 VIF

각 예측변수에 대한 VIF 값은 다음과 같습니다.

시간: 1,169
준비_시험: 1,403
현재_점수: 1.522

VIF 값은 1부터 시작하며 상한이 없습니다. VIF를 해석하는 일반적인 규칙은 다음과 같습니다.

값 1은 주어진 예측 변수와 모델의 다른 예측 변수 사이에 상관 관계가 없음을 나타냅니다.
1과 5 사이의 값은 주어진 예측 변수와 모델의 다른 예측 변수 사이의 중간 정도의 상관 관계를 나타내지만 특별한 주의가 필요할 만큼 심각하지는 않은 경우가 많습니다.
5보다 큰 값은 주어진 예측 변수와 모델의 다른 예측 변수 사이에 잠재적으로 심각한 상관 관계가 있음을 나타냅니다. 이 경우 회귀 결과의 계수 추정치와 p-값은 신뢰할 수 없을 가능성이 높습니다.

이 예에서 예측 변수에 대한 VIF 값 중 어느 것도 5보다 크지 않음을 알 수 있는데, 이는 다중 공선성이 회귀 모델에서 문제가 되지 않음을 나타냅니다.

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: SPSS의 다중 공선성

저자 소개

벤자민 앤더슨

의견을 추가하다