Alcance vs. desvio padrão: quando usar cada um


O intervalo e o desvio padrão são duas maneiras de medir a distribuição de valores em um conjunto de dados.

O intervalo representa a diferença entre o valor mínimo e o valor máximo em um conjunto de dados.

O desvio padrão mede o desvio típico dos valores individuais do valor médio. É calculado da seguinte forma:

s = √(Σ(x ix ) 2 / (n-1))

Ouro:

  • Σ: Um símbolo que significa “soma”
  • x i : O valor da i-ésima observação na amostra
  • x : A amostra significa
  • n: O tamanho da amostra

Por exemplo, suponha que temos o seguinte conjunto de dados:

Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

O intervalo é calculado como: 31 -1 = 32.

Podemos usar uma calculadora para descobrir que o desvio padrão é 9,25.

Faixa e desvio padrão: semelhanças e diferenças

O intervalo e o desvio padrão compartilham a seguinte semelhança:

  • Ambas as métricas medem a distribuição de valores em um conjunto de dados.

No entanto, o intervalo e o desvio padrão têm a seguinte diferença:

  • O intervalo nos diz a diferença entre o maior e o menor valor no conjunto de dados.
  • O desvio padrão nos indica o desvio típico dos valores individuais do valor médio do conjunto de dados.

Alcance vs. Desvio padrão: quando usar cada um

Precisamos usar range quando quisermos entender a diferença entre o maior e o menor valor em um conjunto de dados.

Por exemplo, suponha que um professor dê uma prova para 100 alunos. Ela pode usar a escala para entender a diferença entre a pontuação mais alta e a mais baixa alcançada por todos os alunos da turma.

Por outro lado, devemos usar o desvio padrão quando quisermos compreender até que ponto o valor típico de um conjunto de dados se desvia do valor médio.

Por exemplo, se um professor aplica um exame a 100 alunos, ele pode usar o desvio padrão para quantificar o quanto a nota típica do exame se desvia da nota média do exame.

É importante notar que não precisamos escolher entre usar intervalo ou desvio padrão para descrever a distribuição de valores em um conjunto de dados. Podemos usar ambas as métricas porque elas nos fornecem informações completamente diferentes.

As desvantagens do alcance e do desvio padrão

Tanto o intervalo quanto o desvio padrão apresentam uma desvantagem: ambos são influenciados por valores discrepantes .

Para ilustrar isso, considere o seguinte conjunto de dados:

Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Podemos calcular os seguintes valores para o intervalo e desvio padrão deste conjunto de dados:

  • Alcance: 31
  • Desvio padrão: 9,25

No entanto, considere se o conjunto de dados tinha um valor atípico extremo:

Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Poderíamos usar uma calculadora para encontrar as seguintes métricas para este conjunto de dados:

  • Alcance: 377
  • Desvio padrão: 85,02

Observe como o intervalo e o desvio padrão mudam significativamente devido a um valor discrepante.

Embora o intervalo e o desvio padrão possam ser medidas úteis para se ter uma ideia da distribuição de valores em um conjunto de dados, você deve primeiro garantir que o conjunto de dados não contenha quaisquer valores discrepantes que influenciem esses valores. medidas. Caso contrário, o intervalo e o desvio padrão podem ser enganosos.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *