Alcance vs. desvio padrão: quando usar cada um
O intervalo e o desvio padrão são duas maneiras de medir a distribuição de valores em um conjunto de dados.
O intervalo representa a diferença entre o valor mínimo e o valor máximo em um conjunto de dados.
O desvio padrão mede o desvio típico dos valores individuais do valor médio. É calculado da seguinte forma:
s = √(Σ(x i – x ) 2 / (n-1))
Ouro:
- Σ: Um símbolo que significa “soma”
- x i : O valor da i-ésima observação na amostra
- x : A amostra significa
- n: O tamanho da amostra
Por exemplo, suponha que temos o seguinte conjunto de dados:
Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
O intervalo é calculado como: 31 -1 = 32.
Podemos usar uma calculadora para descobrir que o desvio padrão é 9,25.
Faixa e desvio padrão: semelhanças e diferenças
O intervalo e o desvio padrão compartilham a seguinte semelhança:
- Ambas as métricas medem a distribuição de valores em um conjunto de dados.
No entanto, o intervalo e o desvio padrão têm a seguinte diferença:
- O intervalo nos diz a diferença entre o maior e o menor valor no conjunto de dados.
- O desvio padrão nos indica o desvio típico dos valores individuais do valor médio do conjunto de dados.
Alcance vs. Desvio padrão: quando usar cada um
Precisamos usar range quando quisermos entender a diferença entre o maior e o menor valor em um conjunto de dados.
Por exemplo, suponha que um professor dê uma prova para 100 alunos. Ela pode usar a escala para entender a diferença entre a pontuação mais alta e a mais baixa alcançada por todos os alunos da turma.
Por outro lado, devemos usar o desvio padrão quando quisermos compreender até que ponto o valor típico de um conjunto de dados se desvia do valor médio.
Por exemplo, se um professor aplica um exame a 100 alunos, ele pode usar o desvio padrão para quantificar o quanto a nota típica do exame se desvia da nota média do exame.
É importante notar que não precisamos escolher entre usar intervalo ou desvio padrão para descrever a distribuição de valores em um conjunto de dados. Podemos usar ambas as métricas porque elas nos fornecem informações completamente diferentes.
As desvantagens do alcance e do desvio padrão
Tanto o intervalo quanto o desvio padrão apresentam uma desvantagem: ambos são influenciados por valores discrepantes .
Para ilustrar isso, considere o seguinte conjunto de dados:
Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Podemos calcular os seguintes valores para o intervalo e desvio padrão deste conjunto de dados:
- Alcance: 31
- Desvio padrão: 9,25
No entanto, considere se o conjunto de dados tinha um valor atípico extremo:
Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Poderíamos usar uma calculadora para encontrar as seguintes métricas para este conjunto de dados:
- Alcance: 377
- Desvio padrão: 85,02
Observe como o intervalo e o desvio padrão mudam significativamente devido a um valor discrepante.
Embora o intervalo e o desvio padrão possam ser medidas úteis para se ter uma ideia da distribuição de valores em um conjunto de dados, você deve primeiro garantir que o conjunto de dados não contenha quaisquer valores discrepantes que influenciem esses valores. medidas. Caso contrário, o intervalo e o desvio padrão podem ser enganosos.