R에서 클러스터링된 표준 편차를 계산하는 방법
합동 표준 편차는 단순히 두 개 이상의 독립 그룹의 표준 편차에 대한 가중 평균입니다.
통계에서는 두 모집단의 평균이 동일한지 여부를 검정하는 데 사용되는 2-표본 t-검정 에서 가장 일반적으로 나타납니다.
두 그룹의 군집 표준 편차를 계산하는 공식은 다음과 같습니다.
합동 표준 편차 = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
금:
- n1 , n2 : 각각 그룹 1과 그룹 2의 샘플 크기입니다.
- s 1 , s 2 : 각각 그룹 1과 그룹 2의 표준 편차입니다.
다음 예에서는 R의 두 그룹 간의 군집 표준 편차를 계산하는 두 가지 방법을 보여줍니다.
방법 1: 군집화된 표준 편차를 수동으로 계산
두 샘플에 대해 다음과 같은 데이터 값이 있다고 가정합니다.
- 샘플 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- 샘플 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
다음 코드는 이러한 두 샘플 간의 합동 표준 편차를 계산하는 방법을 보여줍니다.
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
합동 표준편차는 5.789564 입니다.
방법 2: 패키지를 사용하여 군집화된 표준 편차 계산
R에서 두 샘플 사이의 합동 표준 편차를 계산하는 또 다른 방법은 effectize 패키지의 sd_pooled() 함수를 사용하는 것입니다.
다음 코드는 실제로 이 함수를 사용하는 방법을 보여줍니다.
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
합동 표준편차는 5.789564 입니다.
이는 이전 예에서 수동으로 계산한 값과 일치합니다.
추가 리소스
다음 자습서에서는 군집 표준 편차 계산에 대한 자세한 정보를 제공합니다.
군집 표준편차 소개
군집 표준편차 계산기