Medidas de forma

Este artigo explica o que são medidas de forma. Assim, você aprenderá para que servem as métricas de forma, como as métricas de forma são interpretadas e como esses tipos de métricas estatísticas são calculados.

O que são medidas de forma?

Nas estatísticas, as medidas de forma são indicadores que nos permitem descrever uma distribuição de probabilidade de acordo com a sua forma. Ou seja, as medidas de forma são usadas para determinar a aparência de uma distribuição sem a necessidade de representá-la graficamente.

Existem dois tipos de medidas de forma: assimetria e curtose. A assimetria indica quão simétrica é uma distribuição, enquanto a curtose indica quão concentrada uma distribuição está em torno de sua média.

Quais são as medidas da forma?

Considerando a definição de medidas de forma, esta seção mostra o que são esses tipos de parâmetros estatísticos.

Nas estatísticas, distinguimos duas medidas de forma:

  • Skewness : Indica se uma distribuição é simétrica ou assimétrica.
  • Curtose – Indica se uma distribuição é íngreme ou plana.

Assimetria

Existem três tipos de assimetria :

  • Assimetria positiva : A distribuição tem mais valores diferentes à direita da média do que à sua esquerda.
  • Simetria : A distribuição tem o mesmo número de valores à esquerda da média e à direita da média.
  • Assimetria negativa : A distribuição tem mais valores diferentes à esquerda da média do que à sua direita.
tipos de assimetria

coeficiente de assimetria

O coeficiente de assimetria , ou índice de assimetria , é um coeficiente estatístico que ajuda a determinar a assimetria de uma distribuição. Assim, calculando o coeficiente de assimetria, é possível saber o tipo de assimetria da distribuição sem ter que fazer uma representação gráfica da mesma.

Embora existam diferentes fórmulas para calcular o coeficiente de assimetria, e veremos todas a seguir, independente da fórmula utilizada, a interpretação do coeficiente de assimetria é sempre feita da seguinte forma:

  • Se o coeficiente de assimetria for positivo, a distribuição será positivamente assimétrica .
  • Se o coeficiente de assimetria for zero, a distribuição é simétrica .
  • Se o coeficiente de assimetria for negativo, a distribuição será distorcida negativamente .
Coeficiente de assimetria de Fisher

O coeficiente de assimetria de Fisher é igual ao terceiro momento em relação à média dividido pelo desvio padrão da amostra. Portanto, a fórmula do coeficiente de assimetria de Fisher é:

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

Equivalentemente, qualquer uma das duas fórmulas a seguir pode ser usada para calcular o coeficiente de Fisher:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

Ouro

E

é a expectativa matemática,

\mu

a média aritmética,

\sigma

o desvio padrão e

N

o número total de dados.

Por outro lado, se os dados estiverem agrupados você pode usar a seguinte fórmula:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

Onde neste caso

x_i

É a marca da classe e

f_i

a frequência absoluta do curso.

Coeficiente de assimetria de Pearson

O coeficiente de assimetria de Pearson é igual à diferença entre a média amostral e a moda dividida pelo seu desvio padrão (ou desvio padrão). A fórmula para o coeficiente de assimetria de Pearson é, portanto, a seguinte:

A_p=\cfrac{\mu-Mo}{\sigma}

Ouro

A_p

é o coeficiente de Pearson,

\mu

a média aritmética,

Mo

moda e

\sigma

o desvio padrão.

Tenha em mente que o coeficiente de assimetria de Pearson só pode ser calculado se for uma distribuição unimodal, ou seja, se houver apenas uma moda nos dados.

Coeficiente de assimetria de Bowley

O coeficiente de assimetria de Bowley é igual à soma do terceiro quartil mais o primeiro quartil menos duas vezes a mediana dividida pela diferença entre o terceiro e o primeiro quartis. A fórmula para este coeficiente de assimetria é, portanto, a seguinte:

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Ouro

Q_1

E

Q_3

são respectivamente o primeiro e terceiro quartis e

Me

é a mediana da distribuição.

Achatamento

A curtose , também chamada de assimetria , indica o quão concentrada uma distribuição está em torno de sua média. Em outras palavras, a curtose indica se uma distribuição é íngreme ou plana. Especificamente, quanto maior a curtose de uma distribuição, mais acentuada (ou mais nítida) ela é.

lisonjeiro

Existem três tipos de bajulação :

  • Leptocúrtica : a distribuição é muito pontiaguda, ou seja, os dados estão fortemente concentrados em torno da média. Mais precisamente, as distribuições leptocúrticas são definidas como distribuições mais nítidas do que a distribuição normal.
  • Mesocúrtica : A curtose da distribuição é equivalente à curtose da distribuição normal. Portanto, não é considerado pontiagudo nem achatado.
  • Platicúrtica : a distribuição é muito achatada, ou seja, a concentração em torno da média é baixa. Formalmente, as distribuições platicúrticas são definidas como distribuições mais planas do que a distribuição normal.

Observe que os diferentes tipos de curtose são definidos tomando como referência a curtose da distribuição normal.

tipos de lisonjeiro

Coeficiente de achatamento

A fórmula para o coeficiente de curtose é a seguinte:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

A fórmula do coeficiente de curtose para dados agrupados em tabelas de frequência :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

Por fim, a fórmula do coeficiente de curtose para dados agrupados em intervalos :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

Ouro:

  • g_2

    é o coeficiente de curtose.

  • N

    é o número total de dados.

  • x_i

    é o i-ésimo dado da série.

  • \mu

    é a média aritmética da distribuição.

  • \sigma

    é o desvio padrão (ou desvio típico) da distribuição.

  • f_i

    é a frequência absoluta do conjunto de dados it.

  • c_i

    é a nota da classe do i-ésimo grupo.

Observe que em todas as fórmulas do coeficiente de curtose, 3 é subtraído porque é o valor de curtose da distribuição normal. Assim, o cálculo do coeficiente de curtose é feito tomando como referência a curtose da distribuição normal. É por isso que às vezes nas estatísticas se diz que se calcula uma curtose excessiva .

Uma vez calculado o coeficiente de curtose, ele deve ser interpretado da seguinte forma para identificar que tipo de curtose se trata:

  • Se o coeficiente de curtose for positivo, significa que a distribuição é leptocúrtica .
  • Se o coeficiente de curtose for zero, significa que a distribuição é mesocúrtica .
  • Se o coeficiente de curtose for negativo, significa que a distribuição é platicúrtica .

Outros tipos de medidas estatísticas

Você também pode estar interessado em qualquer uma das seguintes medidas estatísticas. Clique em uma para ver o que são e como são calculadas.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *