Variância da amostra vs. variância populacional: qual é a diferença?


A variância é uma forma de medir a distribuição de valores em um conjunto de dados.

A fórmula para calcular a variância populacional é:

σ 2 = Σ (x i – μ) 2 / N

Ouro:

  • Σ : Um símbolo que significa “soma”
  • μ : Média populacional
  • x i : O i- ésimo elemento da população
  • N : Tamanho da população

A fórmula para calcular a variância amostral é:

s 2 = Σ ( xix ) 2 / (n-1)

Ouro:

  • x : média amostral
  • x i : O i- ésimo elemento da amostra
  • n : Tamanho da amostra

Observe que há apenas uma pequena diferença entre as duas fórmulas:

Quando calculamos a variância populacional, dividimos por N (o tamanho da população).

Quando calculamos a variância da amostra, dividimos por n-1 (o tamanho da amostra – 1).

Ao calcular a variância amostral, aplicamos o que chamamos de correção de Bessel , que envolve a divisão por n-1.

Sem nos prendermos a detalhes matemáticos, a divisão por n-1 pode fornecer uma estimativa imparcial da variância populacional, que é o valor no qual normalmente estamos interessados.

Quando calcular a variância amostral versus a variância populacional

Se você não tiver certeza se deve calcular a variância amostral ou a variância populacional, lembre-se desta regra geral:

Você deve calcular a variação amostral quando o conjunto de dados com o qual está trabalhando representa uma amostra retirada de uma população de interesse maior.

Você deve calcular a variação populacional quando o conjunto de dados com o qual está trabalhando representa uma população inteira, ou seja, todos os valores nos quais você está interessado.

Os exemplos a seguir mostram diferentes cenários para calcular a variação amostral versus a variação populacional.

Exemplo: Calculando a Variância da Amostra

Suponha que um botânico queira calcular a variação de altura de uma determinada espécie de planta. Como existem milhares de plantas individuais em uma área, ela decide pegar uma amostra aleatória simples de 20 plantas e medir a altura de cada uma.

Neste cenário, o botânico deve calcular a variância da amostra porque está interessado na variância de toda a população de plantas, mas está simplesmente usando esta amostra para estimar a verdadeira variância da população.

Exemplo: cálculo da variância populacional

Suponha que um professor queira calcular a variância das notas dos exames dos 20 alunos de sua turma.

Neste cenário, o professor deve calcular a variância populacional , pois o conjunto de dados com o qual está trabalhando (os resultados dos 20 exames) representa toda a população de interesse.

Recursos adicionais

Os tutoriais a seguir explicam como calcular a variância amostral e a variância populacional em diferentes softwares estatísticos:

Como calcular a variação amostral e populacional no Excel
Como calcular a variância amostral e populacional em R
Como calcular a variação amostral e populacional em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *