Medições de dispersão
Neste artigo, você aprenderá o que são medidas de dispersão e para que servem essas métricas estatísticas. Além disso, você poderá ver como cada medida de dispersão é calculada.
O que são medidas de dispersão?
Medidas de dispersão são medidas estatísticas que indicam a dispersão de um conjunto de dados. Ou seja, medidas de dispersão são utilizadas para avaliar o grau de dispersão dos dados em uma amostra.
As medidas de dispersão também são chamadas de medidas de variabilidade ou medidas de dispersão .
Quais são as medidas de dispersão?
As medidas de dispersão são as seguintes:
- Desvio padrão (ou desvio padrão)
- Variância
- Coeficiente de variação
- Limpo
- Intervalo interquartil
- Diferença média
A seguir explica-se como determinar cada medida de dispersão.
Desvio padrão
O desvio padrão , também chamado de desvio típico , é igual à raiz quadrada da soma dos quadrados dos desvios da série de dados dividida pelo número total de observações.
A fórmula para esta medida de dispersão é, portanto, a seguinte:
Variância
A variância é igual à soma dos quadrados dos resíduos sobre o número total de observações. A fórmula para esta métrica de dispersão é, portanto, a seguinte:
Ouro:
-
é a variável aleatória para a qual você deseja calcular a variância.
-
é o valor dos dados
.
-
é o número total de observações.
-
é a média da variável aleatória
.
Coeficiente de variação
Nas estatísticas, o coeficiente de variação é uma medida de dispersão usada para determinar a dispersão de um conjunto de dados em relação à sua média. O coeficiente de variação é calculado dividindo o desvio padrão dos dados pela sua média e depois multiplicando por 100 para expressar o valor em percentagem.
Limpo
Faixa é uma medida de dispersão que indica a diferença entre o valor máximo e mínimo dos dados em uma amostra. Portanto, para calcular a extensão de uma população ou amostra estatística, o valor máximo deve ser subtraído do valor mínimo.
Intervalo interquartil
O intervalo interquartil , também chamado de intervalo interquartil , é uma medida de dispersão estatística que indica a diferença entre o terceiro e o primeiro quartis.
Portanto, para calcular o intervalo interquartil de um conjunto de dados estatísticos, você deve primeiro encontrar o terceiro e o primeiro quartil e depois subtraí-los.
O símbolo para o intervalo interquartil é IQR, do inglês interquartil range .
Uma das características mais vantajosas desta medida de dispersão é que ela é uma estatística robusta, ou seja, possui alta robustez a outliers. Como os valores extremos não são levados em consideração no cálculo do intervalo interquartil, seu valor variará muito pouco caso surjam novos outliers .
Diferença média
O desvio médio , também chamado de desvio médio absoluto , é a média dos desvios absolutos. O desvio médio é, portanto, igual à soma dos desvios de cada item de dados da média aritmética dividida pelo número total de itens de dados.
Para que são utilizadas as medições de dispersão?
As medidas de dispersão são usadas para avaliar a dispersão de uma amostra estatística. Ou seja, as medidas de dispersão permitem quantificar a dispersão de um conjunto de dados e, a partir dos valores obtidos, pode-se analisar a dispersão da amostra de dados.
As medidas de dispersão são amplamente utilizadas porque ajudam a descrever uma amostra de dados. As medidas de dispersão ajudam a compreender a aparência de uma série de dados.
Outras medidas estatísticas que também são frequentemente calculadas são medidas de tendência central e medidas de posição. Normalmente, uma única medição estatística não é determinada, mas sim múltiplas medições para entender melhor a aparência dos dados que estão sendo estudados.