O que é considerado um bom desvio padrão?
O desvio padrão é usado para medir a distribuição dos valores em uma amostra.
Podemos usar a seguinte fórmula para calcular o desvio padrão de uma determinada amostra:
√ Σ( xi – x barra ) 2 / (n-1)
Ouro:
- Σ: Um símbolo que significa “soma”
- x i : o i- ésimo valor da amostra
- x bar : A amostra significa
- n: O tamanho da amostra
Quanto maior o valor do desvio padrão, mais dispersos são os valores em uma amostra . Por outro lado, quanto menor o valor do desvio padrão, mais próximos os valores estão agrupados.
Uma pergunta que os alunos costumam fazer é: o que é considerado um bom valor para o desvio padrão?
A resposta: um desvio padrão não pode ser “bom” ou “ruim”, porque simplesmente nos indica a distribuição dos valores em uma amostra.
Também não existe um número universal para determinar se um desvio padrão é “alto” ou “baixo”. Por exemplo, considere os seguintes cenários:
Cenário 1: Um corretor de imóveis coleta dados de preços de 100 casas em sua cidade e descobre que o desvio padrão dos preços é de US$ 12.000.
Cenário 2 : Um economista mede o imposto de renda total arrecadado nos 50 estados dos Estados Unidos e descobre que o desvio padrão do imposto de renda total arrecadado é de US$ 480.000.
Embora o desvio padrão do cenário 2 seja muito superior ao desvio padrão do cenário 1, as unidades medidas no cenário 2 são muito superiores, uma vez que o total de impostos arrecadados pelos estados é obviamente muito superior aos preços dos imóveis.
Isto significa que não existe um número único que possamos utilizar para determinar se um desvio padrão é “bom” ou “mau”, ou mesmo “alto” ou “baixo”, porque depende da situação.
Use o coeficiente de variação
Uma maneira de determinar se um desvio padrão é alto é compará-lo com a média do conjunto de dados.
Um coeficiente de variação , muitas vezes abreviado para CV , é uma forma de medir a dispersão dos valores em um conjunto de dados em relação à média. É calculado da seguinte forma:
CV = s/ x
Ouro:
- s: o desvio padrão do conjunto de dados
- x : a média do conjunto de dados
Simplificando, CV é a razão entre o desvio padrão e a média.
Quanto maior o CV, maior o desvio padrão da média. Em geral, um valor de CV superior a 1 é frequentemente considerado elevado.
Por exemplo, suponha que um corretor de imóveis colete dados de preços de 100 casas em sua cidade e descubra que o preço médio é de US$ 150.000 e o desvio padrão dos preços é de US$ 12.000. O CV seria calculado da seguinte forma:
- CV: $ 12.000 / $ 150.000 = 0,08
Como este valor de CV é muito menor que 1, isso nos diz que o desvio padrão dos dados é bastante baixo.
Por outro lado, suponha que um economista meça o imposto de renda total arrecadado nos 50 estados dos Estados Unidos e descubra que a média da amostra é de US$ 400.000 e o desvio padrão é de US$ 480.000. O CV seria calculado da seguinte forma:
- CV: $ 480.000 / $ 400.000 = 1,2
Como esse valor de CV é maior que 1, isso nos indica que o desvio padrão dos valores dos dados é bastante alto.
Comparando desvios padrão entre conjuntos de dados
Freqüentemente usamos o desvio padrão para medir a distribuição de valores em diferentes conjuntos de dados.
Por exemplo, suponha que um professor aplique três exames a seus alunos ao longo de um semestre. Em seguida, calcula o desvio padrão das pontuações de cada exame:
- Exemplo de desvio padrão dos resultados do exame 1: 4,6
- Exemplo de desvio padrão dos resultados do exame 2: 12,4
- Exemplo de desvio padrão dos resultados do exame 3: 2,3
Isso informa ao professor que os resultados do exame foram mais dispersos no exame 2, enquanto os resultados foram mais agrupados no exame 3.
Recursos adicionais
Desvio padrão e erro padrão: qual a diferença?
Desvio padrão versus intervalo interquartil: qual a diferença?