Yate 연속성 수정: 정의 및 예


카이제곱 독립성 검정은 두 범주형 변수 사이에 유의미한 연관성이 있는지 여부를 확인하는 데 사용됩니다.

이 테스트에서는 다음과 같은 귀무가설과 대립가설을 사용합니다.

  • H 0 : (귀무가설) 두 변수는 독립적입니다.
  • H 1 : (대립 가설) 두 변수는 독립적 이지 않습니다 . (즉, 연관되어 있음)

이 테스트에 대한 카이제곱 x 2 테스트 통계량을 계산하려면 다음 공식을 사용합니다.

X 2 = Σ(O i -E i ) 2 / E i

금:

  • Σ: “합”을 의미하는 화려한 기호입니다.
  • O: 관측값
  • E: 기대값

이 테스트에서는 분할표의 빈도의 이산 확률이 연속 분포인 카이제곱 분포에 의해 근사화될 수 있다고 가정합니다.

그러나 이 가정은 약간 부정확한 경향이 있으며 결과 테스트 통계는 위쪽으로 편향되는 경향이 있습니다.

이 편향을 수정하기 위해 Yate의 연속성 수정을 적용할 수 있습니다. 이는 공식 X2 에 다음 수정을 적용합니다.

X 2 = Σ(|O i -E i | – 0.5) 2 / E i

일반적으로 분할표의 하나 이상의 셀이 예상 빈도가 5보다 작은 경우에만 이 수정을 사용합니다.

예: Yate의 연속성 수정 적용

성별이 정당 선호와 연관되어 있는지 여부를 알고 싶다고 가정해 보겠습니다. 우리는 유권자 40명을 무작위로 표본 추출하여 선호하는 정당에 대해 질문합니다. 다음 표는 설문 조사 결과를 나타냅니다.

Yate의 연속성 수정을 사용하여 카이제곱 독립성 검정을 수행하는 방법은 다음과 같습니다.

관찰된 값:

예상 값:

참고: 행 합계에 열 합계를 곱한 다음 총합계로 나누어 각 셀의 기대값을 계산합니다. 예를 들어, 예상되는 공화당 남성 수는 (21*19)/40 = 9.975입니다.

카이 제곱 검정 통계량 : _

  • (|8-9.975| – 0.5) 2 / 9.975 = 0.218
  • (|9-6.3| – 0.5) 2 / 6.3 = 0.768
  • (|4-4.725| – 0.5) 2 / 4.725 = 0.011
  • (|11-9.025| – 0.5) 2 / 9.025 = 0.241
  • (|3-5.7| – 0.5) 2 / 5.7 = 0.849
  • (|5-4.275| – 0.5) 2 / 4.275 = 0.012

그래서 ,

P-값: 카이제곱-P-값 계산기 에 따르면 자유도가 2인 카이제곱 검정 통계량에 해당하는 p-값은 0.3501 입니다.

이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 성별과 정당 선호도 사이에 연관성이 있다고 말할 수 있는 충분한 증거가 없음을 의미합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다