Sas에서 white의 테스트를 수행하는 방법


White의 테스트는 회귀 모델에 이분산성이 존재하는지 여부를 확인하는 데 사용됩니다.

이분산성은 회귀 모델에서 반응 변수 의 다양한 수준에서 잔차가 고르지 않게 분산되는 것을 의미하며, 이는 잔차가 반응 변수의 각 수준에서 동일하게 분산된다는 선형 회귀의 주요 가정 중 하나를 위반합니다.

이 튜토리얼에서는 SAS에서 White 테스트를 수행하여 주어진 회귀 모델에서 이분산성이 문제인지 여부를 확인하는 방법을 설명합니다.

예: SAS의 화이트 테스트

학생의 최종 시험 성적을 예측하기 위해 공부한 시간과 치른 연습 시험 횟수를 사용하는 다중 선형 회귀 모델을 적합화한다고 가정해 보겠습니다.

시험 점수 = β 0 + β 1 (시간) + β 2 (준비 시험)

먼저 다음 코드를 사용하여 학생 20명에 대한 이 정보가 포함된 데이터세트를 만듭니다.

 /*create dataset*/
data exam_data;
    input hours prep_exams score;
    datalines ;
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 90
5 4 90
3 4 82
4 4 85
6 5 90
2 1 83
1 0 62
2 1 76
;
run ;

/*view dataset*/
proc print data =exam_data; 

다음으로 proc reg를 사용하여 이 다중 선형 회귀 모델을 적합하게 하고 spec 옵션을 사용하여 이분산성에 대한 White의 테스트를 수행합니다.

 /*fit regression model and perform White's test*/
proc reg data =exam_data;
    model score = hours prep_exams / spec ;
run ;
quit ; 

SAS의 화이트 테스트

마지막 결과표는 White의 테스트 결과를 보여줍니다.

이 표에서 카이제곱 검정 통계량은 3.54 이고 해당 p-값은 0.6175 임을 알 수 있습니다.

White 테스트에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

  • Null (H 0 ) : 이분산성이 존재하지 않습니다.
  • 대안( HA ): 이분산성이 존재합니다.

p-값이 0.05 이상이므로 귀무가설을 기각할 수 없습니다.

이는 회귀 모델에 이분산성이 존재한다고 주장할 수 있는 충분한 증거가 없음을 의미합니다.

따라서 회귀 요약표에서 계수 추정치의 표준 오차를 안전하게 해석하는 것이 가능합니다.

다음에 무엇을할지

White 검정의 귀무가설을 기각하지 못하면 이분산성이 존재하지 않으며 계속해서 원래 회귀의 결과를 해석할 수 있습니다.

그러나 귀무 가설을 기각하면 데이터에 이분산성이 존재한다는 의미입니다. 이 경우 회귀 출력 테이블에 표시되는 표준 오류는 신뢰할 수 없습니다.

이 문제를 해결하는 몇 가지 일반적인 방법은 다음과 같습니다.

1. 반응 변수를 변환합니다. 반응 변수에 대한 변환을 시도할 수 있습니다.

예를 들어 원래 응답 변수 대신 로그 응답 변수를 사용할 수 있습니다.

일반적으로 반응변수의 로그를 취하는 것은 이분산성을 없애는 효과적인 방법이다.

또 다른 일반적인 변환은 반응 변수의 제곱근을 사용하는 것입니다.

2. 가중 회귀를 사용하십시오. 이 유형의 회귀는 적합치의 분산을 기반으로 각 데이터 포인트에 가중치를 할당합니다.

이는 분산이 더 높은 데이터 포인트에 작은 가중치를 부여하여 잔차 제곱을 줄입니다.

적절한 가중치를 사용하면 이분산성 문제를 해결할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다