Stata에서 qq 플롯을 만들고 해석하는 방법


QQ 플롯 (“분위수-분위수”)은 회귀 분석의 잔차가 정규 분포를 따르는지 여부를 평가하는 데 자주 사용됩니다.

이 튜토리얼에서는 Stata에서 QQ 플롯을 생성하고 해석하는 방법을 설명합니다.

예: Stata의 QQ 플롯

이 예에서는 Stata에 내장된 자동 데이터 세트를 사용합니다. 설명 변수로 mpg변위 를 사용하고 응답 변수로 가격을 사용하여 다중 선형 회귀 모델을 적합합니다. 그런 다음 모델의 잔차를 얻고 QQ 플롯을 만들어 잔차가 정규 분포를 따르는지 확인합니다.

1단계: 데이터를 로드하고 표시합니다.

먼저 다음 명령을 사용하여 데이터를 로드합니다.

시스템 자동 사용

다음으로, 다음 명령을 사용하여 데이터에 대한 빠른 요약을 얻습니다.

요약

Stata에서 순서를 요약합니다.

2단계: 회귀 모델을 적합시킵니다.

다음으로 회귀 모델을 맞추기 위해 다음 명령을 사용합니다.

회귀 가격 mpg 변위

Stata의 회귀 모델 출력

3단계: 잔차를 계산합니다 .

잔차는 단순히 예측된 반응 값(추정 회귀 방정식으로 계산됨)과 실제 반응 값 간의 차이라는 점을 기억하십시오.

Residuals 명령을 사용하고 이 값을 원하는 이름의 변수에 저장하여 각 예측의 잔차를 얻을 수 있습니다. 이 경우 resid_price라는 이름을 사용합니다.

레지던시_가격, 잔차 예측

4단계: QQ 플롯을 만듭니다.

이제 잔여물 목록이 있으므로 qnorm 명령을 사용하여 QQ 플롯을 만들 수 있습니다.

qnorm 가격_잔류

Stata의 QQ 플롯

5단계: QQ 플롯을 해석합니다.

QQ 플롯의 아이디어는 간단합니다. 잔차가 45도 각도로 대략 직선을 따르는 경우 잔차는 대략 정규 분포를 따릅니다. 위의 QQ 플롯에서 잔차는 특히 끝 부분에서 45도 선에서 약간 벗어나는 경향이 있으며 이는 정규 분포가 아님을 나타낼 수 있습니다.

QQ 플롯은 공식적인 통계 테스트는 아니지만 잔차가 정규 분포를 따르는지 여부를 시각적으로 확인할 수 있는 간단한 방법을 제공합니다.

잔차가 QQ 플롯의 45도 선에서 크게 벗어난 것으로 밝혀지면 회귀 분석에서 반응 변수에 대한 변환(예: 반응 변수의 제곱근 또는 로그 사용)을 수행하는 것을 고려할 수 있습니다.

잔차가 약간만 벗어나면 회귀 분석이 정규성 편차에 대해 상당히 견고하기 때문에 응답 변수 변환에 대해 걱정할 필요가 없습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다