카이제곱 독립성 검정: 정의, 공식 및 예
카이제곱 독립성 검정은 두 범주형 변수 사이에 유의미한 연관성이 있는지 여부를 확인하는 데 사용됩니다.
이 튜토리얼에서는 다음 내용을 설명합니다.
- 카이제곱 독립성 검정을 수행하려는 동기.
- 카이제곱 독립성 검정을 수행하는 공식입니다.
- 카이제곱 독립성 검정을 수행하는 방법의 예입니다.
카이제곱 독립성 검정: 동기 부여
카이제곱 독립성 검정은 다양한 상황에서 두 범주형 변수 사이에 연관성이 있는지 여부를 확인하는 데 사용할 수 있습니다. 여기 몇 가지 예가 있어요.
- 우리는 성별이 정당 선호와 연관되어 있는지 알고 싶습니다. 그래서 우리는 유권자 500명을 대상으로 설문조사를 실시하고 그들의 성별과 선호 정당을 기록합니다.
- 우리는 사람이 좋아하는 색깔이 좋아하는 스포츠와 연관되어 있는지 알고 싶습니다. 그래서 우리는 100명을 대상으로 설문조사를 실시하고 두 가지 모두에 대해 선호하는 것이 무엇인지 물었습니다.
- 교육 수준과 결혼 여부가 연관되어 있는지 알고 싶습니다. 따라서 우리는 50명의 단순 무작위 표본을 통해 이 두 변수에 대한 데이터를 수집합니다.
이러한 각 시나리오에서 우리는 두 개의 범주형 변수가 서로 연관되어 있는지 알고 싶습니다. 각 시나리오에서 카이제곱 독립성 검정을 사용하여 변수 간에 통계적으로 유의미한 연관성이 있는지 확인할 수 있습니다.
카이제곱 독립성 검정: 공식
카이제곱 독립성 검정에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.
- H 0 : (귀무가설) 두 변수는 독립적입니다.
- H 1 : (대립 가설) 두 변수는 독립적 이지 않습니다 . (즉, 연관되어 있음)
다음 공식을 사용하여 카이제곱 x 2 검정 통계량을 계산합니다.
X 2 = Σ(OE) 2 / E
금:
- Σ: “합”을 의미하는 화려한 기호입니다.
- O: 관측값
- E: 기대값
(#rows-1)*(#columns-1) 자유도를 갖는 검정 통계량 X 2 에 해당하는 p-값이 선택한 유의 수준보다 작은 경우 귀무 가설을 기각할 수 있습니다.
카이제곱 독립성 검정: 예
성별이 정당 선호와 연관되어 있는지 여부를 알고 싶다고 가정해 보겠습니다. 우리는 유권자 500명을 무작위로 표본 추출하여 선호하는 정당에 대해 질문합니다. 다음 표는 설문 조사 결과를 나타냅니다.
공화주의자 | 민주당 | 독립적인 | 총 | |
남성 | 120 | 90 | 40 | 250 |
여성 | 110 | 95 | 45 | 250 |
총 | 230 | 185 | 85 | 500 |
성별이 정당 선호도와 연관되어 있는지 확인하기 위해 카이제곱 독립성 검정을 수행하려면 다음 단계를 수행하십시오.
1단계: 가정을 정의합니다.
다음 가정을 사용하여 카이제곱 독립성 검정을 수행합니다.
- H 0 : 성별과 정당 선호는 독립적입니다.
- H 1 : 성별과 정당 선호는 독립적이지 않습니다 .
2단계: 기대값을 계산합니다.
다음으로 다음 공식을 사용하여 분할표의 각 셀에 대한 기대값을 계산합니다.
예상 값 = (행 합계 * 열 합계) / 테이블 합계.
예를 들어, 공화당 남성의 기대값은 (230*250) / 500 = 115 입니다.
이 공식을 반복하여 각 테이블 셀의 예상 값을 얻을 수 있습니다.
공화주의자 | 민주당 | 독립적인 | 총 | |
남성 | 115 | 92.5 | 42.5 | 250 |
여성 | 115 | 92.5 | 42.5 | 250 |
총 | 230 | 185 | 85 | 500 |
3단계: 표의 각 셀에 대해 (OE) 2 /E를 계산합니다.
다음으로, 표의 각 셀에 대해 (OE) 2 /E를 계산합니다. 여기서:
- O: 관측값
- E: 기대값
예를 들어 남성 공화당원의 값은 (120-115) 2 /115 = 0.2174 입니다.
테이블의 각 셀에 대해 이 공식을 반복할 수 있습니다.
공화주의자 | 민주당 | 독립적인 | |
남성 | 0.2174 | 0.0676 | 0.1471 |
여성 | 0.2174 | 0.0676 | 0.1471 |
4단계: 검정 통계량 X2 와 해당 p-값을 계산합니다.
X 2 = σ(OE) 2 / E = 0.2174 + 0.2174 + 0.0676 + 0.0676 + 0.1471 + 0.1471 = 0.8642
P 값에 대한 카이제곱 점수 계산기 에 따르면 X 2 = 0.8642 및 (2-1)*(3-1) = 2 자유도와 관련된 p 값은 0.649198 입니다.
5단계: 결론을 도출합니다.
이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 성별과 정당 선호도 사이에 연관성이 있다고 말할 수 있는 충분한 증거가 없음을 의미합니다.
참고: 카이제곱 독립 검정 계산기를 사용하여 이 전체 검정을 수행할 수도 있습니다.
추가 리소스
다음 자습서에서는 다양한 통계 프로그램을 사용하여 카이제곱 독립성 검정을 수행하는 방법을 설명합니다.
Stata에서 카이제곱 독립성 검정을 수행하는 방법
Excel에서 카이제곱 독립성 검정을 수행하는 방법
SPSS에서 카이제곱 독립성 검정을 수행하는 방법
Python에서 카이제곱 독립성 테스트를 수행하는 방법
R에서 카이제곱 독립성 테스트를 수행하는 방법
TI-84 계산기를 사용한 카이제곱 독립성 테스트
독립성 계산기의 카이제곱 검정