R'de havuzlanmış varyans nasıl hesaplanır


İstatistiklerde küme varyansı , iki veya daha fazla küme varyansının ortalamasını ifade eder.

Gruplar arasındaki ortak varyans için tek bir sayı elde etmek amacıyla iki veya daha fazla grup varyansını “bir araya getirdiğimizi” belirtmek için “havuzlanmış” kelimesini kullanırız.

Uygulamada, havuzlanmış varyans en çok iki örneklemli t testinde kullanılır; bu test, iki popülasyonun ortalamalarının eşit olup olmadığını belirlemek için kullanılır.

İki örnek arasındaki havuzlanmış varyans genellikle sp 2 ile gösterilir ve aşağıdaki şekilde hesaplanır:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

Ne yazık ki, R’de iki grup arasındaki havuzlanmış varyansı hesaplayacak yerleşik bir işlev yoktur, ancak bunu oldukça kolay hesaplayabiliriz.

Örneğin, aşağıdaki iki grup arasındaki birleştirilmiş varyansı hesaplamak istediğimizi varsayalım:

Aşağıdaki kod, R’de bu gruplar arasındaki havuzlanmış varyansın nasıl hesaplanacağını gösterir:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

Bu iki grup arasındaki toplu varyans 46,97143 olarak ortaya çıkıyor.

Ek kaynaklar

Kümelenmiş varyans nedir? (Tanım ve örnek)
Paketlenmiş Boşluk Hesaplayıcı
Excel’de Havuzlanmış Varyans Nasıl Hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir