R에서 카이제곱 적합도 테스트를 수행하는 방법


카이 제곱 적합도 검정은 범주형 변수가 가상 분포를 따르는지 여부를 확인하는 데 사용됩니다.

이 튜토리얼에서는 R에서 카이제곱 적합도 테스트를 수행하는 방법을 설명합니다.

예: R의 카이제곱 적합도 검정

한 상점 주인은 매주 같은 수의 고객이 자신의 상점을 방문한다고 말합니다. 이 가설을 테스트하기 위해 연구원은 특정 주에 매장에 오는 고객 수를 기록하고 다음을 알아냈습니다.

  • 월요일: 고객 50명
  • 화요일: 고객 60명
  • 수요일: 고객 40명
  • 목요일: 고객 47명
  • 금요일: 고객 53명

R에서 카이제곱 적합도 테스트를 수행하여 데이터가 상점 주인의 주장과 일치하는지 확인하려면 다음 단계를 따르세요.

1단계: 데이터를 생성합니다.

먼저, 관찰된 빈도와 매일 예상되는 고객 비율을 포함하는 두 개의 테이블을 만듭니다.

 observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

2단계: 카이제곱 적합도 검정을 수행합니다.

다음으로, 다음 구문을 사용하는 chisq.test() 함수를 사용하여 카이제곱 적합 테스트를 수행할 수 있습니다.

chisq.test(x, p)

금:

  • x: 관찰된 주파수의 수치 벡터입니다.
  • p: 예상 비율의 수치 벡터입니다.

다음 코드는 예제에서 이 함수를 사용하는 방법을 보여줍니다.

 #perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

	Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

카이제곱 검정 통계량은 4.36 이고 해당 p-값은 0.3595 입니다.

p-값은 자유도(dof)가 n-1인 카이제곱 값에 해당합니다. 여기서 n은 다양한 범주의 수입니다. 이 경우 df = 5-1 = 4입니다.

카이제곱 대 P-값 계산기를 사용하여 df = 4인 X 2 = 4.36에 해당하는 p-값이 0.35947 인지 확인할 수 있습니다.

카이제곱 적합도 검정에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

  • H 0 : (귀무가설) 변수는 가설적인 분포를 따릅니다.
  • H 1 : (대립 가설) 변수가 가설 분포를 따르지 않습니다.

p-값(0.35947)이 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 실제 고객 분포가 매장 주인이 보고한 분포와 다르다고 말할 수 있는 충분한 증거가 없음을 의미합니다.

추가 리소스

R에서 카이제곱 독립성 테스트를 수행하는 방법
R에서 카이제곱 통계의 P 값을 계산하는 방법
R에서 임계 카이제곱 값을 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다