R의 카이제곱 독립성 테스트(예제 포함)
카이제곱 독립성 검정은 두 범주형 변수 사이에 유의미한 연관성이 있는지 여부를 확인하는 데 사용됩니다.
이 튜토리얼에서는 R에서 카이제곱 독립성 테스트를 수행하는 방법을 설명합니다.
예: R의 독립성에 대한 카이제곱 검정
성별이 정당 선호와 연관되어 있는지 여부를 알고 싶다고 가정해 보겠습니다. 우리는 유권자 500명을 무작위로 표본 추출하여 선호하는 정당에 대해 질문합니다. 다음 표는 설문 조사 결과를 나타냅니다.
| 공화주의자 | 민주당 | 독립적인 | 총 | |
| 남성 | 120 | 90 | 40 | 250 |
| 여성 | 110 | 95 | 45 | 250 |
| 총 | 230 | 185 | 85 | 500 |
다음 단계를 사용하여 R에서 독립성에 대한 카이제곱 검정을 수행하여 성별이 정당 선호도와 연관되어 있는지 확인합니다.
1단계: 데이터를 생성합니다.
먼저 데이터를 보관할 테이블을 만듭니다 .
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
2단계: 카이제곱 독립성 검정을 수행합니다.
다음으로 chisq.test() 함수를 사용하여 카이제곱 독립성 테스트를 수행할 수 있습니다.
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
결과를 해석하는 방법은 다음과 같습니다.
- 카이제곱 검정 통계량: 0.86404
- 자유도: 2 (#rows-1 * #columns-1로 계산됨)
- p-값: 0.6492
카이제곱 독립성 검정에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.
- H 0 : (귀무가설) 두 변수는 독립적입니다.
- H 1 : (대립 가설) 두 변수는 독립적 이지 않습니다 .
검정의 p-값(0.6492)이 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 성별과 정당 선호도 사이에 연관성이 있다고 말할 수 있는 충분한 증거가 없음을 의미합니다.
즉, 성별과 정당 선호도는 독립적입니다.
추가 리소스
카이제곱 독립성 검정 소개
독립성 계산기의 카이제곱 검정
R에서 카이제곱 통계의 P 값을 계산하는 방법
R에서 임계 카이제곱 값을 찾는 방법