Como calcular assimetria e curtose em python
Nas estatísticas, a assimetria e a curtose são duas maneiras de medir a forma de uma distribuição.
A assimetria é uma medida da assimetria de uma distribuição. Este valor pode ser positivo ou negativo.
- A assimetria negativa indica que a cauda está no lado esquerdo da distribuição, que se estende em direção a valores mais negativos.
- Uma inclinação positiva indica que a cauda está no lado direito da distribuição, que se estende em direção a valores mais positivos.
- Um valor zero indica que não há assimetria na distribuição, o que significa que a distribuição é perfeitamente simétrica.
A curtose é uma medida para saber se uma distribuição tem cauda pesada ou leve em comparação com uma distribuição normal .
- A curtose de uma distribuição normal é 3.
- Se uma determinada distribuição tiver uma curtose menor que 3, ela é considerada playkurtica , o que significa que tende a produzir menos valores discrepantes e menos extremos do que a distribuição normal.
- Se uma determinada distribuição tiver curtose superior a 3, diz-se que é leptocúrtica , o que significa que tende a produzir mais valores discrepantes do que a distribuição normal.
Nota: Algumas fórmulas (definição de Fisher) subtraem 3 da curtose para facilitar a comparação com a distribuição normal. Usando esta definição, uma distribuição teria maior curtose do que uma distribuição normal se tivesse um valor de curtose maior que 0.
Este tutorial explica como calcular a assimetria e a curtose de um determinado conjunto de dados em Python.
Exemplo: assimetria e achatamento em Python
Suponha que temos o seguinte conjunto de dados:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Para calcular a assimetria e curtose da amostra deste conjunto de dados, podemos usar as funções skew() e kurt() da biblioteca Scipy Stata com a seguinte sintaxe:
- viés (matriz de valores, viés = falso)
- kurt (matriz de valores, preconceito = falso)
Usamos o argumento viés = falso para calcular a assimetria e a curtose da amostra, em oposição à assimetria e curtose da população.
Veja como usar essas funções para nosso conjunto de dados específico:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
A assimetria é 0,032697 e a curtose é 0,118157 .
Isso significa que a distribuição é ligeiramente distorcida positivamente e tem mais valores nas caudas em comparação com uma distribuição normal.
Recurso Adicional: Calculadora de Skewness e Kurtosis
Você também pode calcular a assimetria de um determinado conjunto de dados usando a Calculadora estatística de assimetria e curtose , que calcula automaticamente a assimetria e a curtose de um determinado conjunto de dados.