Medições de dispersão

Neste artigo, você aprenderá o que são medidas de dispersão e para que servem essas métricas estatísticas. Além disso, você poderá ver como cada medida de dispersão é calculada.

O que são medidas de dispersão?

Medidas de dispersão são medidas estatísticas que indicam a dispersão de um conjunto de dados. Ou seja, medidas de dispersão são utilizadas para avaliar o grau de dispersão dos dados em uma amostra.

As medidas de dispersão também são chamadas de medidas de variabilidade ou medidas de dispersão .

Quais são as medidas de dispersão?

As medidas de dispersão são as seguintes:

  • Desvio padrão (ou desvio padrão)
  • Variância
  • Coeficiente de variação
  • Limpo
  • Intervalo interquartil
  • Diferença média

A seguir explica-se como determinar cada medida de dispersão.

Desvio padrão

O desvio padrão , também chamado de desvio típico , é igual à raiz quadrada da soma dos quadrados dos desvios da série de dados dividida pelo número total de observações.

A fórmula para esta medida de dispersão é, portanto, a seguinte:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Variância

A variância é igual à soma dos quadrados dos resíduos sobre o número total de observações. A fórmula para esta métrica de dispersão é, portanto, a seguinte:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Ouro:

  • X

    é a variável aleatória para a qual você deseja calcular a variância.

  • x_i

    é o valor dos dados

    i

    .

  • n

    é o número total de observações.

  • \overline{X}

    é a média da variável aleatória

    X

    .

Coeficiente de variação

Nas estatísticas, o coeficiente de variação é uma medida de dispersão usada para determinar a dispersão de um conjunto de dados em relação à sua média. O coeficiente de variação é calculado dividindo o desvio padrão dos dados pela sua média e depois multiplicando por 100 para expressar o valor em percentagem.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Limpo

Faixa é uma medida de dispersão que indica a diferença entre o valor máximo e mínimo dos dados em uma amostra. Portanto, para calcular a extensão de uma população ou amostra estatística, o valor máximo deve ser subtraído do valor mínimo.

R=\text{M\'ax}-\text{M\'in}

Intervalo interquartil

O intervalo interquartil , também chamado de intervalo interquartil , é uma medida de dispersão estatística que indica a diferença entre o terceiro e o primeiro quartis.

Portanto, para calcular o intervalo interquartil de um conjunto de dados estatísticos, você deve primeiro encontrar o terceiro e o primeiro quartil e depois subtraí-los.

IQR=Q_3-Q_1

O símbolo para o intervalo interquartil é IQR, do inglês interquartil range .

Uma das características mais vantajosas desta medida de dispersão é que ela é uma estatística robusta, ou seja, possui alta robustez a outliers. Como os valores extremos não são levados em consideração no cálculo do intervalo interquartil, seu valor variará muito pouco caso surjam novos outliers .

Diferença média

O desvio médio , também chamado de desvio médio absoluto , é a média dos desvios absolutos. O desvio médio é, portanto, igual à soma dos desvios de cada item de dados da média aritmética dividida pelo número total de itens de dados.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Para que são utilizadas as medições de dispersão?

As medidas de dispersão são usadas para avaliar a dispersão de uma amostra estatística. Ou seja, as medidas de dispersão permitem quantificar a dispersão de um conjunto de dados e, a partir dos valores obtidos, pode-se analisar a dispersão da amostra de dados.

As medidas de dispersão são amplamente utilizadas porque ajudam a descrever uma amostra de dados. As medidas de dispersão ajudam a compreender a aparência de uma série de dados.

Outras medidas estatísticas que também são frequentemente calculadas são medidas de tendência central e medidas de posição. Normalmente, uma única medição estatística não é determinada, mas sim múltiplas medições para entender melhor a aparência dos dados que estão sendo estudados.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *