Variância da amostra vs. variância populacional: qual é a diferença?
A variância é uma forma de medir a distribuição de valores em um conjunto de dados.
A fórmula para calcular a variância populacional é:
σ 2 = Σ (x i – μ) 2 / N
Ouro:
- Σ : Um símbolo que significa “soma”
- μ : Média populacional
- x i : O i- ésimo elemento da população
- N : Tamanho da população
A fórmula para calcular a variância amostral é:
s 2 = Σ ( xi – x ) 2 / (n-1)
Ouro:
- x : média amostral
- x i : O i- ésimo elemento da amostra
- n : Tamanho da amostra
Observe que há apenas uma pequena diferença entre as duas fórmulas:
Quando calculamos a variância populacional, dividimos por N (o tamanho da população).
Quando calculamos a variância da amostra, dividimos por n-1 (o tamanho da amostra – 1).
Ao calcular a variância amostral, aplicamos o que chamamos de correção de Bessel , que envolve a divisão por n-1.
Sem nos prendermos a detalhes matemáticos, a divisão por n-1 pode fornecer uma estimativa imparcial da variância populacional, que é o valor no qual normalmente estamos interessados.
Quando calcular a variância amostral versus a variância populacional
Se você não tiver certeza se deve calcular a variância amostral ou a variância populacional, lembre-se desta regra geral:
Você deve calcular a variação amostral quando o conjunto de dados com o qual está trabalhando representa uma amostra retirada de uma população de interesse maior.
Você deve calcular a variação populacional quando o conjunto de dados com o qual está trabalhando representa uma população inteira, ou seja, todos os valores nos quais você está interessado.
Os exemplos a seguir mostram diferentes cenários para calcular a variação amostral versus a variação populacional.
Exemplo: Calculando a Variância da Amostra
Suponha que um botânico queira calcular a variação de altura de uma determinada espécie de planta. Como existem milhares de plantas individuais em uma área, ela decide pegar uma amostra aleatória simples de 20 plantas e medir a altura de cada uma.
Neste cenário, o botânico deve calcular a variância da amostra porque está interessado na variância de toda a população de plantas, mas está simplesmente usando esta amostra para estimar a verdadeira variância da população.
Exemplo: cálculo da variância populacional
Suponha que um professor queira calcular a variância das notas dos exames dos 20 alunos de sua turma.
Neste cenário, o professor deve calcular a variância populacional , pois o conjunto de dados com o qual está trabalhando (os resultados dos 20 exames) representa toda a população de interesse.
Recursos adicionais
Os tutoriais a seguir explicam como calcular a variância amostral e a variância populacional em diferentes softwares estatísticos:
Como calcular a variação amostral e populacional no Excel
Como calcular a variância amostral e populacional em R
Como calcular a variação amostral e populacional em Python