Medidas de variabilidade

Este artigo explica o que são medidas de variabilidade e para que servem esses tipos de medidas estatísticas. Assim, você encontrará a definição de medida de variabilidade, quais são os diferentes tipos de medidas de variabilidade e como as medidas de variabilidade são calculadas.

O que são medidas de variabilidade?

Medidas de variabilidade são medidas estatísticas que indicam a variabilidade de um conjunto de dados. Em outras palavras, as medidas de variabilidade medem a dispersão de uma série de dados.

Portanto, medidas de variabilidade são utilizadas para conhecer a dispersão dos valores em uma amostra. Quanto maior o valor de uma medida de variabilidade, significa que os dados da amostra estão mais distantes uns dos outros. Em geral, é importante que as amostras de dados estejam próximas umas das outras, por isso normalmente tentamos minimizar as medições de variabilidade.

Nas estatísticas, as medidas de variabilidade são importantes porque permitem conhecer a representatividade de uma medida de centralização no conjunto de dados. Se os valores das medidas de variabilidade forem baixos, significa que os dados estão muito concentrados e, portanto, as medidas de centralização descrevem bem todos os dados.

As medidas de variabilidade também podem ser chamadas de medidas de dispersão ou medidas de propagação .

Quais são as medidas de variabilidade?

As medidas de variabilidade são as seguintes:

  • Desvio padrão (ou desvio padrão)
  • Variância
  • Coeficiente de variação
  • Limpo
  • Intervalo interquartil
  • diferença média

O seguinte explica como calcular cada tipo de medida de variabilidade

Desvio padrão

O desvio padrão , também chamado de desvio típico , é igual à raiz quadrada da soma dos quadrados dos desvios da série de dados dividida pelo número total de observações.

Portanto, a fórmula para esta medida de variabilidade é a seguinte:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Variância

A variância é igual à soma dos quadrados dos resíduos sobre o número total de observações. A fórmula para esta métrica de variabilidade é, portanto, a seguinte:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Ouro:

  • X

    é a variável aleatória para a qual você deseja calcular a variância.

  • x_i

    é o valor dos dados

    i

    .

  • n

    é o número total de observações.

  • \overline{X}

    é a média da variável aleatória

    X

    .

Coeficiente de variação

Nas estatísticas, o coeficiente de variação é uma medida de variabilidade usada para determinar a dispersão de um conjunto de dados em relação à sua média. O coeficiente de variação é calculado dividindo o desvio padrão dos dados pela sua média e depois multiplicando por 100 para expressar o valor em percentagem.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Limpo

Faixa é uma medida de variabilidade que indica a diferença entre o valor máximo e mínimo dos dados em uma amostra. Portanto, para calcular a extensão de uma população ou amostra estatística, o valor máximo deve ser subtraído do valor mínimo.

R=\text{M\'ax}-\text{M\'in}

Intervalo interquartil

O intervalo interquartil , também chamado de intervalo interquartil , é uma medida de variabilidade estatística que indica a diferença entre o terceiro e o primeiro quartil.

Portanto, para calcular o intervalo interquartil de um conjunto de dados estatísticos, você deve primeiro encontrar o terceiro e o primeiro quartil e depois subtraí-los.

IQR=Q_3-Q_1

O símbolo para o intervalo interquartil é IQR, do inglês interquartil range .

Uma das características mais vantajosas desta medida de variabilidade é que ela é uma estatística robusta, ou seja, possui alta robustez a outliers. Como os valores extremos não são levados em consideração no cálculo do intervalo interquartil, seu valor variará muito pouco caso surjam novos outliers .

diferença média

O desvio médio , também chamado de desvio médio absoluto , é a média dos desvios absolutos. O desvio médio é, portanto, igual à soma dos desvios de cada item de dados da média aritmética dividida pelo número total de itens de dados.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *