Stata에서 정규성을 테스트하는 방법
많은 통계 테스트에서는 테스트 결과를 신뢰할 수 있으려면 하나 이상의 변수가 정규 분포를 거쳐야 합니다.
이 튜토리얼에서는 Stata에서 변수 간의 정규성을 테스트하는 데 사용할 수 있는 몇 가지 방법을 설명합니다.
이러한 각 방법에 대해 auto 라는 내장 Stata 데이터 세트를 사용합니다. 다음 명령어를 사용하여 이 데이터세트를 로드할 수 있습니다.
시스템 자동 사용
방법 1: 히스토그램
변수가 정규 분포를 이루고 있는지 확인하는 비공식적인 방법은 변수 분포를 표시하는 히스토그램을 만드는 것입니다.
변수가 정규 분포 를 따르는 경우 히스토그램은 중앙에 더 많은 값이 있고 꼬리에 더 적은 값이 있는 “종” 모양을 취해야 합니다.
hist 명령을 사용하여 가변 변위 에 대한 히스토그램을 만들 수 있습니다.
이사 이력
Normal 명령을 사용하여 히스토그램에 정규 밀도 곡선을 추가할 수 있습니다.
이사 이력, 보통
변수 이동이 오른쪽으로 치우쳐 있고(예: 대부분의 값이 왼쪽에 집중되어 있고 값의 긴 “꼬리”가 오른쪽으로 확장됨) 정규 분포를 따르지 않는다는 것은 매우 분명합니다.
관련 항목: 왼쪽 및 오른쪽으로 치우친 분포
방법 2: Shapiro-Wilk 테스트
정규성을 테스트하는 공식적인 방법은 Shapiro-Wilk 테스트를 사용하는 것입니다.
이 검정의 귀무가설은 변수가 정규 분포를 따른다는 것입니다. 검정의 p-값이 특정 유의 수준(일반적으로 0.01, 0.05, 0.10 포함)보다 낮으면 귀무 가설을 기각하고 변수가 정규 분포를 따르지 않는다고 주장할 수 있는 충분한 증거가 있다는 결론을 내릴 수 있습니다. .
*이 테스트는 총 관측값 수가 4~2,000개일 때 사용할 수 있습니다.
swilk 명령을 사용하여 가변 변위 에 대해 Shapiro-Wilk 테스트를 수행할 수 있습니다.
부드러운 움직임
테스트 결과를 해석하는 방법은 다음과 같습니다.
Obs: 74. 이는 테스트에 사용된 관측치의 수입니다.
여: 0.92542. 테스트에 대한 테스트 통계입니다.
문제>z: 0.00031. 이는 검정 통계량과 관련된 p-값입니다.
p-값이 0.05보다 작으므로 검정의 귀무가설을 기각할 수 있습니다. 가변 변위가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있습니다.
swilk 명령 뒤에 여러 변수를 나열하여 여러 변수에 대해 Shapiro-Wilk 테스트를 한 번에 수행할 수도 있습니다.
스윌크 변위 mpg 길이
0.05의 유의 수준을 사용하면 변위 와 mpg가 정규 분포를 따르지 않는다는 결론을 내릴 수 있지만 길이가 정규 분포를 따르지 않는다고 말할 수 있는 증거는 충분하지 않습니다.
방법 3: 샤피로-프란시아 테스트
정규성을 테스트하는 또 다른 공식적인 방법은 Shapiro-Francia 테스트를 사용하는 것입니다.
이 검정의 귀무가설은 변수가 정규 분포를 따른다는 것입니다. 검정의 p-값이 특정 유의 수준보다 낮으면 귀무 가설을 기각하고 변수가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있다는 결론을 내릴 수 있습니다.
*이 테스트는 총 관찰 수가 10~5,000개 사이일 때 사용할 수 있습니다.
sfrancia 명령을 사용하여 가변 변위 에 대해 Shapiro-Wilk 테스트를 수행할 수 있습니다.
움직이는 스프란시아
테스트 결과를 해석하는 방법은 다음과 같습니다.
Obs: 74. 이는 테스트에 사용된 관측치의 수입니다.
W’: 0.93011. 테스트에 대한 테스트 통계입니다.
문제>z: 0.00094. 이는 검정 통계량과 연관된 p-값입니다.
p-값이 0.05보다 작으므로 검정의 귀무가설을 기각할 수 있습니다. 가변 변위가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있습니다.
Shapiro-Wilk 테스트와 유사하게 sfrancia 명령 뒤에 여러 변수를 나열하여 여러 변수에 대해 Shapiro-Francia 테스트를 한 번에 수행할 수 있습니다.
방법 4: 왜도 및 첨도 테스트
정규성을 테스트하는 또 다른 방법은 변수의 왜도와 첨도가 정규 분포와 일치하는지 여부를 확인하는 왜 도 및 첨도 테스트를 사용하는 것입니다.
이 검정의 귀무가설은 변수가 정규 분포를 따른다는 것입니다. 검정의 p-값이 특정 유의 수준보다 낮으면 귀무 가설을 기각하고 변수가 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 있다는 결론을 내릴 수 있습니다.
*이 테스트에는 최소 8개의 관찰이 필요합니다.
sktest 명령을 사용하여 가변 변위 에 대한 왜도 및 첨도 테스트를 수행할 수 있습니다.
시험을 옮기다
테스트 결과를 해석하는 방법은 다음과 같습니다.
Obs: 74. 이는 테스트에 사용된 관측치의 수입니다.
조정 치(2): 5.81. 이는 검정에 대한 카이제곱 검정 통계량입니다.
확률>chi2: 0.0547. 이는 검정 통계량과 연관된 p-값입니다.
p-값이 0.05 이상이므로 검정의 귀무가설을 기각할 수 없습니다. 움직임이 정규 분포를 따르지 않는다고 말할 수 있는 충분한 증거가 없습니다.
다른 정규성 테스트와 마찬가지로 sktest 명령 뒤에 여러 변수를 나열하여 여러 변수에 대한 왜도 및 첨도 테스트를 한 번에 수행할 수 있습니다.