R에서 클러스터링된 표준 편차를 계산하는 방법

에 의해 벤자민 앤더슨 7월 23, 2023 가이드 댓글 0개

합동 표준 편차는 단순히 두 개 이상의 독립 그룹의 표준 편차에 대한 가중 평균입니다.

통계에서는 두 모집단의 평균이 동일한지 여부를 검정하는 데 사용되는 2-표본 t-검정 에서 가장 일반적으로 나타납니다.

두 그룹의 군집 표준 편차를 계산하는 공식은 다음과 같습니다.

합동 표준 편차 = √ (n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² / (n ₁ +n ₂ -2)

금:

_n1 , _n2 : 각각 그룹 1과 그룹 2의 샘플 크기입니다.
s ₁ , s ₂ : 각각 그룹 1과 그룹 2의 표준 편차입니다.

다음 예에서는 R의 두 그룹 간의 군집 표준 편차를 계산하는 두 가지 방법을 보여줍니다.

방법 1: 군집화된 표준 편차를 수동으로 계산

두 샘플에 대해 다음과 같은 데이터 값이 있다고 가정합니다.

샘플 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
샘플 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

다음 코드는 이러한 두 샘플 간의 합동 표준 편차를 계산하는 방법을 보여줍니다.

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

합동 표준편차는 5.789564 입니다.

방법 2: 패키지를 사용하여 군집화된 표준 편차 계산

R에서 두 샘플 사이의 합동 표준 편차를 계산하는 또 다른 방법은 effectize 패키지의 sd_pooled() 함수를 사용하는 것입니다.

다음 코드는 실제로 이 함수를 사용하는 방법을 보여줍니다.

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

합동 표준편차는 5.789564 입니다.

이는 이전 예에서 수동으로 계산한 값과 일치합니다.

추가 리소스

다음 자습서에서는 군집 표준 편차 계산에 대한 자세한 정보를 제공합니다.

군집 표준편차 소개
군집 표준편차 계산기

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

방법 1: 군집화된 표준 편차를 수동으로 계산

방법 2: 패키지를 사용하여 군집화된 표준 편차 계산

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다