Por que o desvio padrão é importante? (explicação + exemplos)


O desvio padrão é usado para medir a distribuição dos valores em uma amostra.

Podemos usar a seguinte fórmula para calcular o desvio padrão de uma determinada amostra:

Σ( xi – x barra ) 2 / (n-1)

Ouro:

  • Σ: Um símbolo que significa “soma”
  • x i : o i- ésimo valor da amostra
  • x bar : A amostra significa
  • n: O tamanho da amostra

Quanto maior o valor do desvio padrão, mais dispersos são os valores em uma amostra. Por outro lado, quanto menor o valor do desvio padrão, mais próximos os valores estão agrupados.

Uma pergunta que os alunos costumam fazer é: Por que o desvio padrão é importante?

A resposta: O desvio padrão é importante porque nos informa a distribuição dos valores em um determinado conjunto de dados.

analisamos um conjunto de dados sempre que queremos encontrar as seguintes métricas:

  • O centro do conjunto de dados . A maneira mais comum de medir o “centro” é usando a média e a mediana.
  • A distribuição de valores no conjunto de dados . A forma mais comum de medir o spread é usar o desvio padrão.

Sabendo onde está o centro e qual é a distribuição dos valores, podemos entender bem a distribuição dos valores em qualquer conjunto de dados.

Os exemplos a seguir ilustram a importância do desvio padrão na prática.

Exemplo 1: Distribuição salarial

Suponha que o salário médio na empresa A seja de US$ 80.000 e o desvio padrão seja de US$ 20.000. Como o desvio padrão é tão grande, não há garantia de que você receberá perto de US$ 80.000 por ano se trabalhar nesta empresa, porque existe essa variação nos salários.

Por outro lado, suponha que o salário médio na Empresa B também seja de US$ 80.000, mas o desvio padrão seja de apenas US$ 4.000. Como esse desvio padrão é tão pequeno, você pode ter certeza de que receberá perto de US$ 80.000, pois há muito pouca variação nos salários.

Se criássemos um boxplot para visualizar a distribuição salarial nessas duas empresas, ficaria assim:

Observe que o comprimento do boxplot para a empresa A é maior, pois o desvio padrão dos salários é muito maior.

Ambas as empresas têm o mesmo salário médio, mas a diferença salarial é muito maior na empresa A.

Exemplo 2: Distribuição dos preços da habitação

Suponha que o preço médio da habitação no bairro A seja de US$ 250.000 e o desvio padrão seja de US$ 50.000. Como o desvio padrão é bastante grande, isso significa que alguns preços de casas serão muito superiores a US$ 250.000 e outros serão muito mais baixos. Se você olhar para qualquer casa neste bairro, não há garantia de que o preço estará próximo da média.

Por outro lado, suponha que o preço médio da casa no bairro B também seja de US$ 250.000, mas o desvio padrão seja de apenas US$ 10.000. Como esse desvio padrão é bem pequeno, você pode ter certeza de que qualquer casa que você olhar na vizinhança provavelmente estará fechada por esse preço.

Se criássemos um boxplot para visualizar a distribuição dos preços das casas nesses dois bairros, ele ficaria assim:

O comprimento do boxplot do bairro A é maior porque o desvio padrão dos preços dos imóveis é muito maior.

Na verdade, os preços das moradias variam de menos de US$ 150.000 a mais de US$ 400.000 para o bairro A, enquanto os preços variam apenas de cerca de US$ 230.000 a US$ 270.000 para o bairro B.

Simplesmente conhecendo o desvio padrão dos preços das casas em cada bairro, podemos saber quanta variação esperar nos preços em cada bairro.

Recursos adicionais

O que é considerado um bom desvio padrão?
Alcance vs. Desvio padrão: quando usar cada um
Coeficiente de variação versus desvio padrão: a diferença

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *