Como calcular a variância agrupada em r


Nas estatísticas, a variância do cluster refere-se à média de duas ou mais variâncias do cluster.

Usamos a palavra “agrupado” para indicar que estamos “agrupando” duas ou mais variações de grupo para obter um único número para a variação comum entre os grupos.

Na prática, a variância agrupada é usada com mais frequência em um teste t de duas amostras , que é usado para determinar se as médias de duas populações são iguais ou não.

A variância combinada entre duas amostras é geralmente denotada como sp 2 e é calculada da seguinte forma:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

Infelizmente, não existe uma função integrada para calcular a variância agrupada entre dois grupos em R, mas podemos calculá-la facilmente.

Por exemplo, suponha que queiramos calcular a variância combinada entre os dois grupos a seguir:

O código a seguir mostra como calcular a variação agrupada entre esses grupos em R:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

A variância combinada entre esses dois grupos é 46,97143 .

Recursos adicionais

O que é variação agrupada? (Definição e exemplo)
Calculadora de lacunas agrupada
Como calcular a variação agrupada no Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *