Jak obliczyć łączną wariancję w r


W statystyce wariancja skupień odnosi się do średniej z dwóch lub więcej wariancji skupień.

Słowa „łączone” używamy, aby wskazać, że „łączymy” dwie lub więcej wariancji grupowych w celu uzyskania jednej liczby dla wspólnej wariancji między grupami.

W praktyce wariancję zbiorczą stosuje się najczęściej w teście t dla dwóch prób , który służy do ustalenia, czy średnie z dwóch populacji są równe.

Łączną wariancję pomiędzy dwiema próbkami ogólnie oznacza się jako sp 2 i oblicza się w następujący sposób:

s p 2 = ( (n 1 -1) s 1 2 + (n 2 -1) s 2 2 ) / (n 1 + n 2 -2)

Niestety, nie ma wbudowanej funkcji obliczającej łączną wariancję między dwiema grupami w R, ale możemy to obliczyć całkiem łatwo.

Załóżmy na przykład, że chcemy obliczyć łączną wariancję między następującymi dwiema grupami:

Poniższy kod pokazuje, jak obliczyć łączną wariancję między tymi grupami w R:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

Łączna wariancja pomiędzy tymi dwiema grupami wynosi 46,97143 .

Dodatkowe zasoby

Co to jest wariancja skupiona? (Definicja i przykład)
Kalkulator przerw w pakiecie
Jak obliczyć łączną wariancję w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *