R에서 합동 분산을 계산하는 방법
통계에서 군집 분산은 두 개 이상의 군집 분산의 평균을 나타냅니다.
그룹 간의 공통 분산에 대한 단일 숫자를 얻기 위해 두 개 이상의 그룹 분산을 “풀링”한다는 의미로 “풀링됨”이라는 단어를 사용합니다.
실제로 합동 분산은 두 모집단의 평균이 같은지 여부를 확인하는 데 사용되는 2-표본 t-검정 에서 가장 자주 사용됩니다.
두 표본 간의 합동 분산은 일반적으로 sp 2 로 표시되며 다음과 같이 계산됩니다.
s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
불행하게도 R에는 두 그룹 간의 통합 분산을 계산하는 내장 함수가 없지만 매우 쉽게 계산할 수 있습니다.
예를 들어, 다음 두 그룹 간의 통합 분산을 계산한다고 가정합니다.
다음 코드는 R에서 이러한 그룹 간의 합동 분산을 계산하는 방법을 보여줍니다.
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
이 두 그룹 간의 통합 분산은 46.97143 입니다.