Stata에서 카이제곱 적합도 테스트를 수행하는 방법


카이제곱 적합도 검정은 범주형 변수가 가상 분포를 따르는지 여부를 확인하는 데 사용됩니다.

이 튜토리얼에서는 Stata에서 카이제곱 적합도 테스트를 수행하는 방법을 설명합니다.

예: Stata의 카이제곱 적합도 검정

이 테스트를 수행하는 방법을 설명하기 위해 1988년 미국 여성의 노동 통계에 대한 정보가 포함된 nlsw88 이라는 데이터 세트를 사용합니다.

다음 단계에 따라 카이제곱 적합도 검정을 수행하여 이 데이터 집합의 실제 인종 분포가 백인 70%, 흑인 20%, 기타 10%인지 확인합니다.

1단계: 원시 데이터를 로드하고 표시합니다.

먼저 다음 명령을 입력하여 데이터를 로드합니다.

nlsw88 시스템

다음 명령을 입력하면 원시 데이터를 볼 수 있습니다.

br

Stata에서 원시 데이터 보기

각 행에는 연령, 인종, 결혼 상태, 교육 수준 및 기타 다양한 요소를 포함하여 개인에 대한 정보가 표시됩니다.

2단계: 조정 패키지를 로드합니다.

적합성 테스트를 수행하려면 csgof 패키지를 설치해야 합니다. 다음 명령을 입력하여 이를 수행할 수 있습니다.

csgof 찾기

새 창이 나타납니다. https://stats.idre.ucla.edu/stat/stata/ado/analytic 에서 csgof 링크를 클릭하세요.

또 다른 창이 나타납니다. 설치하려면 여기를 클릭하십시오 라는 링크를 클릭합니다.

패키지를 설치하는 데는 몇 초 밖에 걸리지 않습니다.

3단계: 적합성 테스트를 수행합니다.

패키지가 설치되면 데이터에 대한 적합도 테스트를 수행하여 실제 인종 분석이 백인 70%, 흑인 20%, 기타 10%인지 확인할 수 있습니다.

테스트를 수행하기 위해 다음 구문을 사용합니다.

csgof Variable_of_interest, expperc(list_of_expected_percentages)

이 경우에 사용할 정확한 구문은 다음과 같습니다.

csgof, expperc(70, 20, 10) 실행

Stata의 카이제곱 적합도

결과를 해석하는 방법은 다음과 같습니다.

요약 상자: 이 상자에는 각 경주의 예상 비율, 예상 빈도 및 관찰 빈도가 표시됩니다. 예를 들어:

  • 백인의 예상 비율은 70%였다. 이것은 우리가 지정한 백분율입니다.
  • 백인 개인의 예상 빈도는 1,572.2였습니다. 이는 데이터 세트에 2,246명의 개인이 있다는 사실을 사용하여 계산되었으므로 해당 숫자의 70%는 1,572.2입니다.
  • 백인의 관찰 빈도는 1,637명이었습니다. 이는 데이터 세트에 있는 실제 백인 개인의 수입니다.

Chisq(2): 적합도 검정에 대한 카이제곱 검정 통계량입니다. 218.13으로 나옵니다.

p: 카이제곱 검정 통계량과 관련된 p-값입니다. 0으로 판명됩니다. 0.05보다 작기 때문에 실제 인종 분포가 백인 70%, 흑인 20%, 기타 10%라는 귀무가설을 기각하지 못합니다. 우리는 실제 인종 분포가 이 가상 분포와 다르다는 결론을 내릴 수 있는 충분한 증거를 가지고 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다