O que é variação agrupada? (definição e #038; exemplo)


Nas estatísticas, a variância do cluster refere-se simplesmente à média de duas ou mais variâncias do cluster.

Usamos a palavra “agrupado” para indicar que estamos “agrupando” duas ou mais variações de grupo para obter um único número para a variação comum entre os grupos.

Na prática, a variância agrupada é usada com mais frequência em um teste t de duas amostras , que é usado para determinar se as médias de duas populações são iguais ou não.

A variância combinada entre duas amostras é geralmente denotada como sp 2 e é calculada da seguinte forma:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

Quando os dois tamanhos de amostra (n 1 e n 2 ) são iguais, a fórmula é simplificada da seguinte forma:

s p 2 = (s 1 2 + s 2 2 ) / 2

Quando calcular a lacuna agrupada

Quando queremos comparar duas médias populacionais, podemos potencialmente usar dois testes estatísticos:

1. Teste t de duas amostras : Este teste assume que as variações entre as duas amostras são aproximadamente iguais. Se usarmos este teste, calculamos a variância combinada.

2. Teste t de Welch : Este teste não pressupõe que as variâncias entre as duas amostras sejam aproximadamente iguais. Se usarmos este teste, não calculamos a variância combinada. Em vez disso, usamos uma fórmula diferente.

Para determinar qual teste usar, usamos a seguinte regra:

Regra geral: se a razão entre a maior variância e a menor variância for menor que 4, então podemos assumir que as variâncias são aproximadamente iguais e usar o teste t de duas amostras.

Por exemplo, suponha que a amostra 1 tenha uma variância de 24,5 e a amostra 2 tenha uma variância de 15,2. A razão entre a maior variância amostral e a menor variância amostral seria calculada da seguinte forma:

Proporção: 24,5 / 15,2 = 1,61

Sendo esta proporção inferior a 4, pode-se assumir que as diferenças entre os dois grupos são aproximadamente iguais. Portanto, usaríamos o teste t de duas amostras, o que significa que calcularíamos a variância combinada.

Exemplo de cálculo do desvio agrupado

Suponha que queiramos saber se o peso médio de duas espécies diferentes de tartarugas é igual ou não. Para testar isso, coletamos uma amostra aleatória de tartarugas de cada população com as seguintes informações:

Amostra 1:

  • Tamanho da amostra n 1 = 40
  • Variância amostral s 1 2 = 18,5

Amostra 2:

  • Tamanho da amostra n 2 = 38
  • Variância amostral s 2 2 = 6,7

Veja como calcular a variação combinada entre as duas amostras:

  • s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • s p 2 = ( (40-1)*18,5 + (38-1)*6,7 ) / (40+38-2)
  • s p 2 = (39*18,5 + 37*6,7) / (76) = 12,755

A variância agrupada é 12.755 .

Observe que o valor da variância agrupada está entre as duas variâncias originais de 18,5 e 6,7. Isso faz sentido, visto que a variância combinada é apenas uma média ponderada das variâncias das duas amostras.

Recurso bônus: use esta calculadora de variância agrupada para calcular automaticamente a variância agrupada entre duas amostras.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *