Como calcular assimetria e curtose em r


Nas estatísticas, a assimetria e a curtose são duas maneiras de medir a forma de uma distribuição.

A assimetria é uma medida da assimetria de uma distribuição. Este valor pode ser positivo ou negativo.

  • A assimetria negativa indica que a cauda está no lado esquerdo da distribuição, que se estende em direção a valores mais negativos.
  • Uma inclinação positiva indica que a cauda está no lado direito da distribuição, que se estende em direção a valores mais positivos.
  • Um valor zero indica que não há assimetria na distribuição, o que significa que a distribuição é perfeitamente simétrica.

A curtose é uma medida para saber se uma distribuição tem cauda pesada ou leve em comparação com uma distribuição normal .

  • A curtose de uma distribuição normal é 3.
  • Se uma determinada distribuição tiver uma curtose menor que 3, ela é considerada playkurtica , o que significa que tende a produzir menos valores discrepantes e menos extremos do que a distribuição normal.
  • Se uma determinada distribuição tiver curtose superior a 3, diz-se que é leptocúrtica , o que significa que tende a produzir mais valores discrepantes do que a distribuição normal.

Nota: Algumas fórmulas (definição de Fisher) subtraem 3 da curtose para facilitar a comparação com a distribuição normal. Usando esta definição, uma distribuição teria maior curtose do que uma distribuição normal se tivesse um valor de curtose maior que 0.

Este tutorial explica como calcular a assimetria e a curtose de um determinado conjunto de dados em R.

Exemplo: assimetria e achatamento em R

Suponha que temos o seguinte conjunto de dados:

 data = c(88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

Podemos visualizar rapidamente a distribuição dos valores neste conjunto de dados criando um histograma:

 hist(data, col=' steelblue ') 

Assimetria e curtose em R

O histograma mostra-nos que a distribuição parece estar distorcida para a esquerda. Ou seja, uma parcela maior dos valores está concentrada no lado direito da distribuição.

Para calcular a assimetria e a curtose deste conjunto de dados, podemos usar as funções skewness() e kurtosis() da biblioteca de momentos em R:

 library (moments)

#calculate skewness
skewness(data)

[1] -1.391777

#calculate kurtosis
kurtosis(data)

[1] 4.177865

A assimetria é -1,391777 e a curtose é 4,177865 .

Como a assimetria é negativa, isso indica que a distribuição permanece distorcida. Isso confirma o que vimos no histograma.

Como a curtose é maior que 3, isso indica que a distribuição tem mais valores nas caudas em comparação com uma distribuição normal.

A biblioteca de momentos também oferece a função jarque.test() , que executa um teste de adequação que determina se os dados da amostra apresentam assimetria e curtose consistentes com uma distribuição normal. As hipóteses nula e alternativa deste teste são as seguintes:

Hipótese nula : o conjunto de dados apresenta assimetria e curtose que correspondem a uma distribuição normal.

Hipótese alternativa : o conjunto de dados apresenta distorção e curtose que não corresponde a uma distribuição normal.

O código a seguir mostra como realizar esse teste:

 jarque.test(data)

	Jarque-Bera Normality Test

data:data
JB = 5.7097, p-value = 0.05756
alternative hypothesis: greater

O valor p do teste é 0,05756 . Como este valor não é inferior a α = 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para dizer que este conjunto de dados apresenta assimetria e curtose diferentes da distribuição normal.

Você pode encontrar a documentação completa da Biblioteca Moments aqui .

Bônus: calculadora de assimetria e curtose

Você também pode calcular a assimetria de um determinado conjunto de dados usando a Calculadora estatística de assimetria e curtose , que calcula automaticamente a assimetria e a curtose de um determinado conjunto de dados.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *