R에서 클러스터링된 표준 편차를 계산하는 방법


합동 표준 편차는 단순히 두 개 이상의 독립 그룹의 표준 편차에 대한 가중 평균입니다.

통계에서는 두 모집단의 평균이 동일한지 여부를 검정하는 데 사용되는 2-표본 t-검정 에서 가장 일반적으로 나타납니다.

두 그룹의 군집 표준 편차를 계산하는 공식은 다음과 같습니다.

합동 표준 편차 = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

금:

  • n1 , n2 : 각각 그룹 1과 그룹 2의 샘플 크기입니다.
  • s 1 , s 2 : 각각 그룹 1과 그룹 2의 표준 편차입니다.

다음 예에서는 R의 두 그룹 간의 군집 표준 편차를 계산하는 두 가지 방법을 보여줍니다.

방법 1: 군집화된 표준 편차를 수동으로 계산

두 샘플에 대해 다음과 같은 데이터 값이 있다고 가정합니다.

  • 샘플 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
  • 샘플 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

다음 코드는 이러한 두 샘플 간의 합동 표준 편차를 계산하는 방법을 보여줍니다.

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

합동 표준편차는 5.789564 입니다.

방법 2: 패키지를 사용하여 군집화된 표준 편차 계산

R에서 두 샘플 사이의 합동 표준 편차를 계산하는 또 다른 방법은 effectize 패키지의 sd_pooled() 함수를 사용하는 것입니다.

다음 코드는 실제로 이 함수를 사용하는 방법을 보여줍니다.

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

합동 표준편차는 5.789564 입니다.

이는 이전 예에서 수동으로 계산한 값과 일치합니다.

추가 리소스

다음 자습서에서는 군집 표준 편차 계산에 대한 자세한 정보를 제공합니다.

군집 표준편차 소개
군집 표준편차 계산기

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다