R'de kümelenmiş standart sapma nasıl hesaplanır


Havuzlanmış standart sapma, iki veya daha fazla bağımsız grubun standart sapmalarının ağırlıklı ortalamasıdır.

İstatistiklerde en yaygın olarak iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılan iki örnekli t testinde görülür.

İki grup için kümelenmiş standart sapmayı hesaplama formülü şöyledir:

Birleştirilmiş standart sapma = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

Altın:

  • n1 , n2 : Sırasıyla grup 1 ve grup 2 için örneklem büyüklüğü.
  • s 1 , s 2 : Sırasıyla grup 1 ve grup 2 için standart sapma.

Aşağıdaki örnekler, R’deki iki grup arasındaki kümelenmiş standart sapmayı hesaplamak için iki yöntemi göstermektedir.

Yöntem 1: Kümelenmiş standart sapmayı manuel olarak hesaplayın

İki örnek için aşağıdaki veri değerlerine sahip olduğumuzu varsayalım:

  • Örnek 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
  • Örnek 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

Aşağıdaki kod, bu iki örnek arasındaki birleştirilmiş standart sapmanın nasıl hesaplanacağını gösterir:

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

Birleştirilmiş standart sapmanın 5,789564 olduğu ortaya çıkıyor.

Yöntem 2: Bir Paket Kullanarak Kümelenmiş Standart Sapmayı Hesaplama

R’deki iki örnek arasındaki havuzlanmış standart sapmayı hesaplamanın başka bir yolu da effectize paketindeki sd_pooled() işlevini kullanmaktır.

Aşağıdaki kod bu işlevin pratikte nasıl kullanılacağını gösterir:

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

Birleştirilmiş standart sapmanın 5,789564 olduğu ortaya çıkıyor.

Bunun önceki örnekte manuel olarak hesapladığımız değerle eşleştiğini unutmayın.

Ek kaynaklar

Aşağıdaki eğitimler, kümelenmiş standart sapmanın hesaplanması hakkında daha fazla bilgi sağlar:

Kümelenmiş Standart Sapmaya Giriş
Kümelenmiş Standart Sapma Hesaplayıcı

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir