R의 카이제곱 독립성 테스트(예제 포함)


카이제곱 독립성 검정은범주형 변수 사이에 유의미한 연관성이 있는지 여부를 확인하는 데 사용됩니다.

이 튜토리얼에서는 R에서 카이제곱 독립성 테스트를 수행하는 방법을 설명합니다.

예: R의 독립성에 대한 카이제곱 검정

성별이 정당 선호와 연관되어 있는지 여부를 알고 싶다고 가정해 보겠습니다. 우리는 유권자 500명을 무작위로 표본 추출하여 선호하는 정당에 대해 질문합니다. 다음 표는 설문 조사 결과를 나타냅니다.

공화주의자 민주당 독립적인
남성 120 90 40 250
여성 110 95 45 250
230 185 85 500

다음 단계를 사용하여 R에서 독립성에 대한 카이제곱 검정을 수행하여 성별이 정당 선호도와 연관되어 있는지 확인합니다.

1단계: 데이터를 생성합니다.

먼저 데이터를 보관할 테이블을 만듭니다 .

 #create table
data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE )
colnames(data) <- c(" Rep "," Dem "," Ind ")
rownames(data) <- c(" Male "," Female ")
data <- as.table (data)

#view table
data

       Rep Dem Ind
Male 120 90 40
Female 110 95 45

2단계: 카이제곱 독립성 검정을 수행합니다.

다음으로 chisq.test() 함수를 사용하여 카이제곱 독립성 테스트를 수행할 수 있습니다.

 #Perform Chi-Square Test of Independence
chisq.test(data)

	Pearson's Chi-squared test

data:data
X-squared = 0.86404, df = 2, p-value = 0.6492

결과를 해석하는 방법은 다음과 같습니다.

  • 카이제곱 검정 통계량: 0.86404
  • 자유도: 2 (#rows-1 * #columns-1로 계산됨)
  • p-값: 0.6492

카이제곱 독립성 검정에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

  • H 0 : (귀무가설) 두 변수는 독립적입니다.
  • H 1 : (대립 가설) 두 변수는 독립적 이지 않습니다 .

검정의 p-값(0.6492)이 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 성별과 정당 선호도 사이에 연관성이 있다고 말할 수 있는 충분한 증거가 없음을 의미합니다.

즉, 성별과 정당 선호도는 독립적입니다.

추가 리소스

카이제곱 독립성 검정 소개
독립성 계산기의 카이제곱 검정
R에서 카이제곱 통계의 P 값을 계산하는 방법
R에서 임계 카이제곱 값을 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다