Stata에서 카이제곱 독립성 검정을 수행하는 방법
카이제곱 독립성 검정은 두 범주형 변수 사이에 유의미한 연관성이 있는지 여부를 확인하는 데 사용됩니다.
이 튜토리얼에서는 Stata에서 카이제곱 독립성 테스트를 수행하는 방법을 설명합니다.
예: Stata의 카이제곱 독립성 검정
이 예에서는 1978년의 74개 자동차에 대한 정보가 포함된 auto 라는 데이터 세트를 사용합니다.
다음 두 변수 사이에 중요한 연관성이 있는지 확인하기 위해 카이제곱 독립성 검정을 수행하려면 다음 단계를 따르십시오.
- rep78: 1978년에 자동차가 수리된 횟수(1~5까지 다양)
- foreign : 자동차 종류가 외국인지 여부 (0 = 아니오, 1 = 예)
1단계: 원시 데이터를 로드하고 표시합니다.
먼저 다음 명령을 입력하여 데이터를 로드합니다.
시스템 자동 사용
다음 명령을 입력하면 원시 데이터를 볼 수 있습니다.
br

각 행에는 가격, mpg, 중량, 길이 및 기타 다양한 변수를 포함하여 개별 자동차에 대한 정보가 표시됩니다. 우리가 관심을 갖는 유일한 두 가지 변수는 rep78 과 Foreign 입니다.
3단계: 카이제곱 독립성 검정을 수행합니다.
테스트를 수행하기 위해 다음 구문을 사용합니다.
탭 first_variable second_variable, chi2
이 경우에 사용할 정확한 구문은 다음과 같습니다.
외국 대표78 탭, chi2

결과를 해석하는 방법은 다음과 같습니다.
요약표: 이 표는 rep78 과 foreign 의 각 조합의 총 개수를 보여줍니다. 예를 들어
- 1978년에는 국산차 2대, 수리 1대가 있었다.
- 국산차는 8대가 있었고 1978년에는 2차 수리를 받았다.
- 1978년에는 국산차 27대가 3차례 수리를 받았다.
등등.
Pearson chisq(4): 테스트에 대한 카이제곱 테스트 통계입니다. 27.2640으로 밝혀졌습니다.
Pr: 카이제곱 검정 통계량과 관련된 p-값입니다. 0.000으로 나옵니다. 이 값은 0.05보다 작으므로 두 변수가 서로 독립적이라는 귀무가설을 기각하지 못합니다. 우리는 외국산 자동차인지 여부와 자동차가 받은 총 수리 횟수 사이에 통계적으로 유의미한 연관성이 있다는 결론을 내릴 수 있는 충분한 증거를 가지고 있습니다.