Stata에서 카이제곱 독립성 검정을 수행하는 방법


카이제곱 독립성 검정은 두 범주형 변수 사이에 유의미한 연관성이 있는지 여부를 확인하는 데 사용됩니다.

이 튜토리얼에서는 Stata에서 카이제곱 독립성 테스트를 수행하는 방법을 설명합니다.

예: Stata의 카이제곱 독립성 검정

이 예에서는 1978년의 74개 자동차에 대한 정보가 포함된 auto 라는 데이터 세트를 사용합니다.

다음 두 변수 사이에 중요한 연관성이 있는지 확인하기 위해 카이제곱 독립성 검정을 수행하려면 다음 단계를 따르십시오.

  • rep78: 1978년에 자동차가 수리된 횟수(1~5까지 다양)
  • foreign : 자동차 종류가 외국인지 여부 (0 = 아니오, 1 = 예)

1단계: 원시 데이터를 로드하고 표시합니다.

먼저 다음 명령을 입력하여 데이터를 로드합니다.

시스템 자동 사용

다음 명령을 입력하면 원시 데이터를 볼 수 있습니다.

br

Stata의 자동 데이터 세트에 대한 원시 데이터

각 행에는 가격, mpg, 중량, 길이 및 기타 다양한 변수를 포함하여 개별 자동차에 대한 정보가 표시됩니다. 우리가 관심을 갖는 유일한 두 가지 변수는 rep78Foreign 입니다.

3단계: 카이제곱 독립성 검정을 수행합니다.

테스트를 수행하기 위해 다음 구문을 사용합니다.

탭 first_variable second_variable, chi2

이 경우에 사용할 정확한 구문은 다음과 같습니다.

외국 대표78 탭, chi2

Stata의 독립 출력에 대한 카이제곱 검정

결과를 해석하는 방법은 다음과 같습니다.

요약표: 이 표는 rep78foreign 의 각 조합의 총 개수를 보여줍니다. 예를 들어

  • 1978년에는 국산차 2대, 수리 1대가 있었다.
  • 국산차는 8대가 있었고 1978년에는 2차 수리를 받았다.
  • 1978년에는 국산차 27대가 3차례 수리를 받았다.

등등.

Pearson chisq(4): 테스트에 대한 카이제곱 테스트 통계입니다. 27.2640으로 밝혀졌습니다.

Pr: 카이제곱 검정 통계량과 관련된 p-값입니다. 0.000으로 나옵니다. 이 값은 0.05보다 작으므로 두 변수가 서로 독립적이라는 귀무가설을 기각하지 못합니다. 우리는 외국산 자동차인지 여부와 자동차가 받은 총 수리 횟수 사이에 통계적으로 유의미한 연관성이 있다는 결론을 내릴 수 있는 충분한 증거를 가지고 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다