R에서 cramer의 v를 계산하는 방법


Cramer의 V는 두 명목 변수 간의 연관성 강도를 측정한 것입니다.

0에서 1까지 진행됩니다. 여기서:

  • 0은 두 변수 사이에 연관성이 없음을 나타냅니다.
  • 1은 두 변수 사이의 강한 연관성을 나타냅니다.

다음과 같이 계산됩니다.

크레이머의 V = √ (X 2 /n) / min(c-1, r-1)

금:

  • X 2 : 카이제곱 통계
  • n: 총 표본 크기
  • r: 라인 수
  • c: 열 수

이 튜토리얼에서는 R의 분할표에 대한 Cramer의 V를 계산하는 몇 가지 예를 제공합니다.

예 1: 2×2 테이블에 대한 Cramer의 V

다음 코드는 rcompanion 패키지의 CramerV 함수를 사용하여 2×2 테이블에 대한 Cramer의 V를 계산하는 방법을 보여줍니다.

 #create 2x2 table
data = matrix(c(7,9,12,8), nrow = 2 )

#view dataset
data

     [,1] [,2]
[1,] 7 12
[2,] 9 8

#load rcompanion library
library(rcompanion)

#calculate Cramer's V
cramerV(data)

Cramer V 
  0.1617

Cramer의 V는 0.1617 로 나타났는데, 이는 표에 있는 두 변수 간의 연관성이 상당히 약함을 나타냅니다.

ci = TRUE를 설정하여 Cramer의 V에 대한 신뢰 구간을 생성할 수도 있습니다.

 cramerV(data, ci = TRUE )

  Cramer.V lower.ci upper.ci
1 0.1617 0.003487 0.4914

Cramer의 V는 0.1617 로 그대로 유지되지만 이제 Cramer의 V의 실제 값이 포함될 가능성이 있는 값 범위를 포함하는 95% 신뢰 구간을 갖게 되었습니다.

이 간격은 [ .003487 , .4914 ]로 나타납니다.

예 2: 더 큰 테이블에 대한 Cramer의 V

CramerV 함수를 사용하여 모든 크기의 배열에 대한 Cramer의 V를 계산할 수 있습니다.

다음 코드는 2개의 행과 3개의 열이 있는 테이블에 대해 Cramer의 V를 계산하는 방법을 보여줍니다.

 #create 2x3 table
data = matrix(c(6, 9, 8, 5, 12, 9), nrow = 2 )

#view dataset
data

     [,1] [,2] [,3]
[1,] 6 8 12
[2,] 9 5 9

#load rcompanion library
library(rcompanion)

#calculate Cramer's V
cramerV(data)

Cramer V 
  0.1775

Cramer의 V는 0.1775 로 나타났습니다.

여기에서 CramerV 기능에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

R의 카이제곱 독립성 검정
R의 카이제곱 적합도 테스트
R에서의 Fisher의 정확한 검정

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다