So berechnen sie schiefe und kurtosis in python
In der Statistik sind Schiefe und Kurtosis zwei Möglichkeiten, die Form einer Verteilung zu messen.
Schiefe ist ein Maß für die Schiefe einer Verteilung. Dieser Wert kann positiv oder negativ sein.
- Eine negative Schiefe zeigt an, dass sich das Ende auf der linken Seite der Verteilung befindet, die sich in Richtung negativerer Werte erstreckt.
- Eine positive Schiefe zeigt an, dass sich das Ende auf der rechten Seite der Verteilung befindet, die sich in Richtung positiverer Werte erstreckt.
- Ein Wert von Null zeigt an, dass die Verteilung keine Asymmetrie aufweist, was bedeutet, dass die Verteilung vollkommen symmetrisch ist.
Kurtosis ist ein Maß dafür, ob eine Verteilung im Vergleich zu einerNormalverteilung stark oder schwach ausgeprägt ist.
- Die Kurtosis einer Normalverteilung beträgt 3.
- Wenn eine bestimmte Verteilung eine Kurtosis von weniger als 3 aufweist, spricht man von einer Playkurtic- Verteilung, was bedeutet, dass sie tendenziell weniger und weniger extreme Ausreißer hervorbringt als die Normalverteilung.
- Wenn eine bestimmte Verteilung eine Kurtosis von mehr als 3 aufweist, spricht man von einer leptokurtischen Verteilung , was bedeutet, dass sie tendenziell mehr Ausreißer als die Normalverteilung hervorbringt.
Hinweis: Einige Formeln (Fisher-Definition) subtrahieren 3 von der Kurtosis, um den Vergleich mit der Normalverteilung zu erleichtern. Nach dieser Definition hätte eine Verteilung eine größere Kurtosis als eine Normalverteilung, wenn sie einen Kurtosis-Wert größer als 0 hätte.
In diesem Tutorial wird erläutert, wie Sie sowohl die Schiefe als auch die Kurtosis eines bestimmten Datensatzes in Python berechnen.
Beispiel: Schiefe und Abflachung in Python
Angenommen, wir haben den folgenden Datensatz:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Um die Stichprobenschiefe und Kurtosis dieses Datensatzes zu berechnen, können wir die Funktionen skew() und kurt() aus der Scipy Stata-Bibliothek mit der folgenden Syntax verwenden:
- Bias (Array von Werten, Bias = falsch)
- Kurt (Wertefeld, Bias = falsch)
Wir verwenden das Argument „bias=False“ , um die Stichprobenschiefe und Kurtosis im Gegensatz zur Populationsschiefe und Kurtosis zu berechnen.
So verwenden Sie diese Funktionen für unseren speziellen Datensatz:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
Die Schiefe beträgt 0,032697 und die Kurtosis 0,118157 .
Dies bedeutet, dass die Verteilung leicht positiv schief ist und im Vergleich zu einer Normalverteilung mehr Werte in den Enden aufweist.
Zusätzliche Ressource: Schiefe- und Kurtosis-Rechner
Sie können die Schiefe für einen bestimmten Datensatz auch mit dem Rechner für statistische Schiefe und Kurtosis berechnen , der automatisch Schiefe und Kurtosis für einen bestimmten Datensatz berechnet.