R에서 cramer의 v를 계산하는 방법
Cramer의 V는 두 명목 변수 간의 연관성 강도를 측정한 것입니다.
0에서 1까지 진행됩니다. 여기서:
- 0은 두 변수 사이에 연관성이 없음을 나타냅니다.
- 1은 두 변수 사이의 강한 연관성을 나타냅니다.
다음과 같이 계산됩니다.
크레이머의 V = √ (X 2 /n) / min(c-1, r-1)
금:
- X 2 : 카이제곱 통계
- n: 총 표본 크기
- r: 라인 수
- c: 열 수
이 튜토리얼에서는 R의 분할표에 대한 Cramer의 V를 계산하는 몇 가지 예를 제공합니다.
예 1: 2×2 테이블에 대한 Cramer의 V
다음 코드는 rcompanion 패키지의 CramerV 함수를 사용하여 2×2 테이블에 대한 Cramer의 V를 계산하는 방법을 보여줍니다.
#create 2x2 table data = matrix(c(7,9,12,8), nrow = 2 ) #view dataset data [,1] [,2] [1,] 7 12 [2,] 9 8 #load rcompanion library library(rcompanion) #calculate Cramer's V cramerV(data) Cramer V 0.1617
Cramer의 V는 0.1617 로 나타났는데, 이는 표에 있는 두 변수 간의 연관성이 상당히 약함을 나타냅니다.
ci = TRUE를 설정하여 Cramer의 V에 대한 신뢰 구간을 생성할 수도 있습니다.
cramerV(data, ci = TRUE )
Cramer.V lower.ci upper.ci
1 0.1617 0.003487 0.4914
Cramer의 V는 0.1617 로 그대로 유지되지만 이제 Cramer의 V의 실제 값이 포함될 가능성이 있는 값 범위를 포함하는 95% 신뢰 구간을 갖게 되었습니다.
이 간격은 [ .003487 , .4914 ]로 나타납니다.
예 2: 더 큰 테이블에 대한 Cramer의 V
CramerV 함수를 사용하여 모든 크기의 배열에 대한 Cramer의 V를 계산할 수 있습니다.
다음 코드는 2개의 행과 3개의 열이 있는 테이블에 대해 Cramer의 V를 계산하는 방법을 보여줍니다.
#create 2x3 table data = matrix(c(6, 9, 8, 5, 12, 9), nrow = 2 ) #view dataset data [,1] [,2] [,3] [1,] 6 8 12 [2,] 9 5 9 #load rcompanion library library(rcompanion) #calculate Cramer's V cramerV(data) Cramer V 0.1775
Cramer의 V는 0.1775 로 나타났습니다.
여기에서 CramerV 기능에 대한 전체 문서를 찾을 수 있습니다.