R'de kümelenmiş standart sapma nasıl hesaplanır
Havuzlanmış standart sapma, iki veya daha fazla bağımsız grubun standart sapmalarının ağırlıklı ortalamasıdır.
İstatistiklerde en yaygın olarak iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılan iki örnekli t testinde görülür.
İki grup için kümelenmiş standart sapmayı hesaplama formülü şöyledir:
Birleştirilmiş standart sapma = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
Altın:
- n1 , n2 : Sırasıyla grup 1 ve grup 2 için örneklem büyüklüğü.
- s 1 , s 2 : Sırasıyla grup 1 ve grup 2 için standart sapma.
Aşağıdaki örnekler, R’deki iki grup arasındaki kümelenmiş standart sapmayı hesaplamak için iki yöntemi göstermektedir.
Yöntem 1: Kümelenmiş standart sapmayı manuel olarak hesaplayın
İki örnek için aşağıdaki veri değerlerine sahip olduğumuzu varsayalım:
- Örnek 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- Örnek 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
Aşağıdaki kod, bu iki örnek arasındaki birleştirilmiş standart sapmanın nasıl hesaplanacağını gösterir:
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
Birleştirilmiş standart sapmanın 5,789564 olduğu ortaya çıkıyor.
Yöntem 2: Bir Paket Kullanarak Kümelenmiş Standart Sapmayı Hesaplama
R’deki iki örnek arasındaki havuzlanmış standart sapmayı hesaplamanın başka bir yolu da effectize paketindeki sd_pooled() işlevini kullanmaktır.
Aşağıdaki kod bu işlevin pratikte nasıl kullanılacağını gösterir:
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
Birleştirilmiş standart sapmanın 5,789564 olduğu ortaya çıkıyor.
Bunun önceki örnekte manuel olarak hesapladığımız değerle eşleştiğini unutmayın.
Ek kaynaklar
Aşağıdaki eğitimler, kümelenmiş standart sapmanın hesaplanması hakkında daha fazla bilgi sağlar:
Kümelenmiş Standart Sapmaya Giriş
Kümelenmiş Standart Sapma Hesaplayıcı