Stata에서 정규성을 테스트하는 방법


많은 통계 테스트에서는 테스트 결과를 신뢰할 수 있으려면 하나 이상의 변수가 정규 분포를 거쳐야 합니다.

이 튜토리얼에서는 Stata에서 변수 간의 정규성을 테스트하는 데 사용할 수 있는 몇 가지 방법을 설명합니다.

이러한 각 방법에 대해 auto 라는 내장 Stata 데이터 세트를 사용합니다. 다음 명령어를 사용하여 이 데이터세트를 로드할 수 있습니다.

시스템 자동 사용

방법 1: 히스토그램

변수가 정규 분포를 이루고 있는지 확인하는 비공식적인 방법은 변수 분포를 표시하는 히스토그램을 만드는 것입니다.

변수가 정규 분포 따르는 경우 히스토그램은 중앙에 더 많은 값이 있고 꼬리에 더 적은 값이 있는 “종” 모양을 취해야 합니다.

hist 명령을 사용하여 가변 변위 에 대한 히스토그램을 만들 수 있습니다.

이사 이력

Stata의 히스토그램 예

Normal 명령을 사용하여 히스토그램에 정규 밀도 곡선을 추가할 수 있습니다.

이사 이력, 보통

Stata의 정규 곡선이 포함된 히스토그램

변수 이동이 오른쪽으로 치우쳐 있고(예: 대부분의 값이 왼쪽에 집중되어 있고 값의 긴 “꼬리”가 오른쪽으로 확장됨) 정규 분포를 따르지 않는다는 것은 매우 분명합니다.

관련 항목: 왼쪽 및 오른쪽으로 치우친 분포

방법 2: Shapiro-Wilk 테스트

정규성을 테스트하는 공식적인 방법은 Shapiro-Wilk 테스트를 사용하는 것입니다.

이 검정의 귀무가설은 변수가 정규 분포를 따른다는 것입니다. 검정의 p-값이 특정 유의 수준(일반적으로 0.01, 0.05, 0.10 포함)보다 낮으면 귀무 가설을 기각하고 변수가 정규 분포를 따르지 않는다고 주장할 수 있는 충분한 증거가 있다는 결론을 내릴 수 있습니다. .

*이 테스트는 총 관측값 수가 4~2,000개일 때 사용할 수 있습니다.

swilk 명령을 사용하여 가변 변위 에 대해 Shapiro-Wilk 테스트를 수행할 수 있습니다.

부드러운 움직임

Stata에서 Shapiro Wilk 출력 테스트

테스트 결과를 해석하는 방법은 다음과 같습니다.

Obs: 74. 이는 테스트에 사용된 관측치의 수입니다.

여: 0.92542. 테스트에 대한 테스트 통계입니다.

문제>z: 0.00031. 이는 검정 통계량과 관련된 p-값입니다.

p-값이 0.05보다 작으므로 검정의 귀무가설을 기각할 수 있습니다. 가변 변위가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있습니다.

swilk 명령 뒤에 여러 변수를 나열하여 여러 변수에 대해 Shapiro-Wilk 테스트를 한 번에 수행할 수도 있습니다.

스윌크 변위 mpg 길이

Stata에서 한 번에 여러 Shapiro-Wilk 테스트

0.05의 유의 수준을 사용하면 변위mpg가 정규 분포를 따르지 않는다는 결론을 내릴 수 있지만 길이가 정규 분포를 따르지 않는다고 말할 수 있는 증거는 충분하지 않습니다.

방법 3: 샤피로-프란시아 테스트

정규성을 테스트하는 또 다른 공식적인 방법은 Shapiro-Francia 테스트를 사용하는 것입니다.

이 검정의 귀무가설은 변수가 정규 분포를 따른다는 것입니다. 검정의 p-값이 특정 유의 수준보다 낮으면 귀무 가설을 기각하고 변수가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있다는 결론을 내릴 수 있습니다.

*이 테스트는 총 관찰 수가 10~5,000개 사이일 때 사용할 수 있습니다.

sfrancia 명령을 사용하여 가변 변위 에 대해 Shapiro-Wilk 테스트를 수행할 수 있습니다.

움직이는 스프란시아

Stata의 Shapiro-Francia 테스트 결과

테스트 결과를 해석하는 방법은 다음과 같습니다.

Obs: 74. 이는 테스트에 사용된 관측치의 수입니다.

W’: 0.93011. 테스트에 대한 테스트 통계입니다.

문제>z: 0.00094. 이는 검정 통계량과 연관된 p-값입니다.

p-값이 0.05보다 작으므로 검정의 귀무가설을 기각할 수 있습니다. 가변 변위가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있습니다.

Shapiro-Wilk 테스트와 유사하게 sfrancia 명령 뒤에 여러 변수를 나열하여 여러 변수에 대해 Shapiro-Francia 테스트를 한 번에 수행할 수 있습니다.

방법 4: 왜도 및 첨도 테스트

정규성을 테스트하는 또 다른 방법은 변수의 왜도와 첨도가 정규 분포와 일치하는지 여부를 확인하는 왜 도 및 첨도 테스트를 사용하는 것입니다.

이 검정의 귀무가설은 변수가 정규 분포를 따른다는 것입니다. 검정의 p-값이 특정 유의 수준보다 낮으면 귀무 가설을 기각하고 변수가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있다는 결론을 내릴 수 있습니다.

*이 테스트에는 최소 8개의 관찰이 필요합니다.

sktest 명령을 사용하여 가변 변위 에 대한 왜도 및 첨도 테스트를 수행할 수 있습니다.

시험을 옮기다

Stata의 정규성을 위한 왜도와 첨도

테스트 결과를 해석하는 방법은 다음과 같습니다.

Obs: 74. 이는 테스트에 사용된 관측치의 수입니다.

조정 치(2): 5.81. 이는 검정에 대한 카이제곱 검정 통계량입니다.

확률>chi2: 0.0547. 이는 검정 통계량과 연관된 p-값입니다.

p-값이 0.05 이상이므로 검정의 귀무가설을 기각할 수 없습니다. 움직임이 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 없습니다.

다른 정규성 테스트와 마찬가지로 sktest 명령 뒤에 여러 변수를 나열하여 여러 변수에 대한 왜도 및 첨도 테스트를 한 번에 수행할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다