Stata에서 카이제곱 적합도 테스트를 수행하는 방법
카이제곱 적합도 검정은 범주형 변수가 가상 분포를 따르는지 여부를 확인하는 데 사용됩니다.
이 튜토리얼에서는 Stata에서 카이제곱 적합도 테스트를 수행하는 방법을 설명합니다.
예: Stata의 카이제곱 적합도 검정
이 테스트를 수행하는 방법을 설명하기 위해 1988년 미국 여성의 노동 통계에 대한 정보가 포함된 nlsw88 이라는 데이터 세트를 사용합니다.
다음 단계에 따라 카이제곱 적합도 검정을 수행하여 이 데이터 집합의 실제 인종 분포가 백인 70%, 흑인 20%, 기타 10%인지 확인합니다.
1단계: 원시 데이터를 로드하고 표시합니다.
먼저 다음 명령을 입력하여 데이터를 로드합니다.
nlsw88 시스템
다음 명령을 입력하면 원시 데이터를 볼 수 있습니다.
br

각 행에는 연령, 인종, 결혼 상태, 교육 수준 및 기타 다양한 요소를 포함하여 개인에 대한 정보가 표시됩니다.
2단계: 조정 패키지를 로드합니다.
적합성 테스트를 수행하려면 csgof 패키지를 설치해야 합니다. 다음 명령을 입력하여 이를 수행할 수 있습니다.
csgof 찾기
새 창이 나타납니다. https://stats.idre.ucla.edu/stat/stata/ado/analytic 에서 csgof 링크를 클릭하세요.
또 다른 창이 나타납니다. 설치하려면 여기를 클릭하십시오 라는 링크를 클릭합니다.
패키지를 설치하는 데는 몇 초 밖에 걸리지 않습니다.
3단계: 적합성 테스트를 수행합니다.
패키지가 설치되면 데이터에 대한 적합도 테스트를 수행하여 실제 인종 분석이 백인 70%, 흑인 20%, 기타 10%인지 확인할 수 있습니다.
테스트를 수행하기 위해 다음 구문을 사용합니다.
csgof Variable_of_interest, expperc(list_of_expected_percentages)
이 경우에 사용할 정확한 구문은 다음과 같습니다.
csgof, expperc(70, 20, 10) 실행

결과를 해석하는 방법은 다음과 같습니다.
요약 상자: 이 상자에는 각 경주의 예상 비율, 예상 빈도 및 관찰 빈도가 표시됩니다. 예를 들어:
- 백인의 예상 비율은 70%였다. 이것은 우리가 지정한 백분율입니다.
- 백인 개인의 예상 빈도는 1,572.2였습니다. 이는 데이터 세트에 2,246명의 개인이 있다는 사실을 사용하여 계산되었으므로 해당 숫자의 70%는 1,572.2입니다.
- 백인의 관찰 빈도는 1,637명이었습니다. 이는 데이터 세트에 있는 실제 백인 개인의 수입니다.
Chisq(2): 적합도 검정에 대한 카이제곱 검정 통계량입니다. 218.13으로 나옵니다.
p: 카이제곱 검정 통계량과 관련된 p-값입니다. 0으로 판명됩니다. 0.05보다 작기 때문에 실제 인종 분포가 백인 70%, 흑인 20%, 기타 10%라는 귀무가설을 기각하지 못합니다. 우리는 실제 인종 분포가 이 가상 분포와 다르다는 결론을 내릴 수 있는 충분한 증거를 가지고 있습니다.