População vs. desvio padrão da amostra: quando usar cada um
O desvio padrão é uma das formas mais comuns de medir a distribuição de valores em um conjunto de dados.
Acontece que existem dois tipos diferentes de desvios padrão que você pode calcular, dependendo do tipo de dados com os quais você está trabalhando.
1. Desvio padrão populacional
Você deve calcular o desvio padrão da população quando o conjunto de dados com o qual está trabalhando representa uma população inteira, ou seja, todos os valores nos quais você está interessado.
A fórmula para calcular um desvio padrão populacional, denotado σ, é:
σ = √ Σ(x i – μ) 2 / N
Ouro:
- Σ : Um símbolo que significa “soma”
- x i : O i- ésimo valor em um conjunto de dados
- μ : A média da população
- N : Tamanho da população
2. Exemplo de desvio padrão
Você deve calcular o desvio padrão da amostra quando o conjunto de dados com o qual está trabalhando representa uma amostra retirada de uma população de interesse maior.
A fórmula para calcular um desvio padrão amostral, denotado s , é:
s = √ Σ( xi – x̄) 2 / (n – 1)
Ouro:
- Σ : Um símbolo que significa “soma”
- x i : O i- ésimo valor em um conjunto de dados
- x̄ : A amostra significa
- n : O tamanho da amostra
Desvio padrão da população em relação à amostra: a diferença
A partir das fórmulas acima, podemos ver que há uma pequena diferença entre a população e o desvio padrão da amostra: Ao calcular o desvio padrão da amostra, dividimos por n-1 em vez de N.
A razão é que quando calculamos o desvio padrão da amostra, tendemos a subestimar a verdadeira variabilidade populacional. Por outras palavras, a nossa estimativa do verdadeiro desvio padrão da população é tendenciosa.*
Para corrigir esse viés, dividimos por n-1. Foi demonstrado que isso torna o desvio padrão da amostra uma estimativa imparcial do desvio padrão da população.
*A prova disso foge ao escopo deste artigo. Para uma prova matemática, consulte este artigo do Stack Exchange .
População vs. Desvio padrão da amostra: quando usar cada um
Use os seguintes problemas práticos para entender melhor quando você deve usar o desvio padrão da população versus o desvio padrão da amostra.
Problema prático 1: Esportes
Suponha que um treinador de basquete queira resumir a média e o desvio padrão dos pontos marcados pelos 12 jogadores de seu time.
Ao calcular o desvio padrão dos pontos obtidos, deve-se utilizar a fórmula do desvio padrão populacional ou amostral?
Resposta: Ele deve usar o desvio padrão da população porque está interessado apenas nos pontos marcados por seus jogadores e não por outros jogadores de outro time.
Problema prático 2: altura
Suponha que um professor de educação física queira resumir a média e o desvio padrão das alturas dos alunos de sua turma.
Ao calcular o desvio padrão da altura, deve-se usar a fórmula do desvio padrão populacional ou amostral?
Resposta: Deve-se usar o desvio padrão da população porque está interessado apenas no tamanho dos alunos daquela turma específica.
Problema prático 3: Biologia
Suponha que um biólogo queira resumir a média e o desvio padrão do peso de uma determinada espécie de tartaruga. Ela decide sair e colher uma amostra aleatória simples de 20 tartarugas da população.
Ao calcular o desvio padrão dos pesos, ela deveria usar a fórmula do desvio padrão populacional ou amostral?
Resposta: Ela deve usar o desvio padrão amostral porque está interessada no peso de toda a população de tartarugas, e não apenas no peso das tartarugas em sua amostra.
Problema prático 4: Fabricação
Suponha que um inspetor queira resumir a média e o desvio padrão do peso dos pneus produzidos em uma determinada fábrica. Ele decide pegar uma amostra aleatória simples de 40 pneus da fábrica e pesa cada um.
Ao calcular o desvio padrão dos pesos, deve-se utilizar a fórmula do desvio padrão populacional ou amostral?
Resposta: Ele deve usar o desvio padrão da amostra porque está interessado no peso de todos os pneus produzidos naquela fábrica, e não apenas no peso dos pneus da sua amostra.
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre o desvio padrão:
Por que o desvio padrão é importante?
O que é considerado um bom desvio padrão?
6 exemplos de uso do desvio padrão na vida real
Coeficiente de variação versus desvio padrão: a diferença