Google 스프레드시트의 카이제곱 적합성 테스트(단계별)


카이제곱 적합도 검정은 범주형 변수가 가상 분포를 따르는지 여부를 확인하는 데 사용됩니다.

예를 들어, 상점 주인이 매주 동일한 수의 고객이 자신의 상점을 방문한다고 주장한다고 가정해 보겠습니다.

이 가설을 테스트하기 위해 독립적인 연구원이 특정 주에 매장에 오는 고객 수를 기록하고 다음을 알아냈습니다.

  • 월요일: 고객 50명
  • 화요일: 고객 60명
  • 수요일: 고객 40명
  • 목요일: 고객 47명
  • 금요일: 고객 53명

데이터가 매장 주인의 주장과 일치하는지 확인하기 위해 카이제곱 적합도 테스트를 수행할 수 있습니다.

이 단계별 예에서는 Google 스프레드시트에서 카이제곱 적합도 테스트를 수행하는 방법을 보여줍니다.

1단계: 데이터 생성

먼저 Google Sheets에 다음 형식으로 데이터를 입력해 보겠습니다.

참고: 총 250명의 고객이 있었습니다. 상점 주인이 매일 같은 수의 고객이 상점에 들어올 것으로 예상한다면 하루에 50명의 고객이 있을 것으로 예상할 것입니다.

2단계: 관측값과 기대값의 차이 계산

적합도 검정에 대한 카이제곱 검정 통계량은 X 2 = Σ(OE) 2 / E 입니다.

금:

  • Σ: “합”을 의미하는 화려한 기호입니다.
  • O: 관측값
  • E: 기대값

다음 공식은 각 행에 대해 (OE) 2 /E를 계산하는 방법을 보여줍니다.

3단계: P-값 계산

마지막으로 다음 공식을 사용하여 카이제곱 검정 통계량과 해당 p-값을 계산합니다.

Excel의 카이제곱 테스트

참고: CHISQ.DIST.RT(x, deg_freedom) 함수는 검정 통계량 x 및 특정 자유도와 연관된 카이 제곱 분포의 올바른 확률을 반환합니다. 자유도는 n-1로 계산됩니다. 이 경우 deg_freedom = 5 – 1 = 4입니다.

검정에 대한 X2 검정 통계량은 4.36 이고 해당 p-값은 0.3595 입니다.

이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 실제 고객 분포가 매장 주인이 보고한 분포와 다르다고 말할 수 있는 충분한 증거가 없음을 의미합니다.

추가 리소스

카이제곱 적합도 검정 소개
카이제곱 적합도 검정 계산기
P값과 통계적 유의성에 대한 설명

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다