Come calcolare asimmetria e curtosi in python
In statistica, l’asimmetria e la curtosi sono due modi per misurare la forma di una distribuzione.
L’asimmetria è una misura dell’asimmetria di una distribuzione. Questo valore può essere positivo o negativo.
- Un’asimmetria negativa indica che la coda si trova sul lato sinistro della distribuzione, che si estende verso valori più negativi.
- Un’inclinazione positiva indica che la coda si trova sul lato destro della distribuzione, che si estende verso valori più positivi.
- Un valore pari a zero indica che non c’è asimmetria nella distribuzione, il che significa che la distribuzione è perfettamente simmetrica.
La curtosi misura se una distribuzione è pesante o leggera rispetto a una distribuzione normale .
- La curtosi di una distribuzione normale è 3.
- Se una data distribuzione ha una curtosi inferiore a 3, si dice che sia playkurtica , nel senso che tende a produrre meno valori anomali e meno estremi rispetto alla distribuzione normale.
- Se una data distribuzione ha una curtosi maggiore di 3, si dice che sia leptokurtica , nel senso che tende a produrre più valori anomali rispetto alla distribuzione normale.
Nota: alcune formule (definizione di Fisher) sottraggono 3 dalla curtosi per facilitare il confronto con la distribuzione normale. Utilizzando questa definizione, una distribuzione avrebbe una curtosi maggiore di una distribuzione normale se avesse un valore di curtosi maggiore di 0.
Questo tutorial spiega come calcolare sia l’asimmetria che la curtosi di un dato set di dati in Python.
Esempio: asimmetria e appiattimento in Python
Supponiamo di avere il seguente set di dati:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Per calcolare l’asimmetria e la curtosi del campione di questo set di dati, possiamo utilizzare le funzioni skew() e kurt() della libreria Scipy Stata con la seguente sintassi:
- bias (array di valori, bias = falso)
- kurt (array di valori, bias = falso)
Utilizziamo l’argomento bias=False per calcolare l’asimmetria e la curtosi del campione in contrapposizione all’asimmetria e alla curtosi della popolazione.
Ecco come utilizzare queste funzioni per il nostro particolare set di dati:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
L’asimmetria risulta essere 0.032697 e la curtosi risulta essere 0.118157 .
Ciò significa che la distribuzione è leggermente distorta positivamente e presenta più valori nelle code rispetto a una distribuzione normale.
Risorsa aggiuntiva: calcolatore di asimmetria e curtosi
È inoltre possibile calcolare l’asimmetria per un determinato set di dati utilizzando il calcolatore statistico di asimmetria e curtosi , che calcola automaticamente l’asimmetria e la curtosi per un determinato set di dati.