Variância da amostra vs. variância populacional: qual é a diferença?

By Dr. benjamim anderson Julho 23, 2023 Guia 0 Comments

A variância é uma forma de medir a distribuição de valores em um conjunto de dados.

A fórmula para calcular a variância populacional é:

σ ² = Σ (x _i – μ) ² / N

Ouro:

Σ : Um símbolo que significa “soma”
μ : Média populacional
x _i : O i- ^ésimo elemento da população
N : Tamanho da população

A fórmula para calcular a variância amostral é:

s ² = Σ ( _xi – x ) ² / (n-1)

Ouro:

x : média amostral
x _i : O i- ^ésimo elemento da amostra
n : Tamanho da amostra

Observe que há apenas uma pequena diferença entre as duas fórmulas:

Quando calculamos a variância populacional, dividimos por N (o tamanho da população).

Quando calculamos a variância da amostra, dividimos por n-1 (o tamanho da amostra – 1).

Ao calcular a variância amostral, aplicamos o que chamamos de correção de Bessel , que envolve a divisão por n-1.

Sem nos prendermos a detalhes matemáticos, a divisão por n-1 pode fornecer uma estimativa imparcial da variância populacional, que é o valor no qual normalmente estamos interessados.

Quando calcular a variância amostral versus a variância populacional

Se você não tiver certeza se deve calcular a variância amostral ou a variância populacional, lembre-se desta regra geral:

Você deve calcular a variação amostral quando o conjunto de dados com o qual está trabalhando representa uma amostra retirada de uma população de interesse maior.

Você deve calcular a variação populacional quando o conjunto de dados com o qual está trabalhando representa uma população inteira, ou seja, todos os valores nos quais você está interessado.

Os exemplos a seguir mostram diferentes cenários para calcular a variação amostral versus a variação populacional.

Exemplo: Calculando a Variância da Amostra

Suponha que um botânico queira calcular a variação de altura de uma determinada espécie de planta. Como existem milhares de plantas individuais em uma área, ela decide pegar uma amostra aleatória simples de 20 plantas e medir a altura de cada uma.

Neste cenário, o botânico deve calcular a variância da amostra porque está interessado na variância de toda a população de plantas, mas está simplesmente usando esta amostra para estimar a verdadeira variância da população.

Exemplo: cálculo da variância populacional

Suponha que um professor queira calcular a variância das notas dos exames dos 20 alunos de sua turma.

Neste cenário, o professor deve calcular a variância populacional , pois o conjunto de dados com o qual está trabalhando (os resultados dos 20 exames) representa toda a população de interesse.

Recursos adicionais

Os tutoriais a seguir explicam como calcular a variância amostral e a variância populacional em diferentes softwares estatísticos:

Como calcular a variação amostral e populacional no Excel
Como calcular a variância amostral e populacional em R
Como calcular a variação amostral e populacional em Python

About Author

Dr. benjamim anderson

Olá, sou Benjamin, um professor aposentado de estatística que se tornou professor dedicado na Statorials. Com vasta experiência e conhecimento na área de estatística, estou empenhado em compartilhar meu conhecimento para capacitar os alunos por meio de Statorials. Saber mais