Hoe scheefheid en kurtosis in python te berekenen
In de statistiek zijn scheefheid en kurtosis twee manieren om de vorm van een verdeling te meten.
Scheefheid is een maatstaf voor de scheefheid van een verdeling. Deze waarde kan positief of negatief zijn.
- Negatieve scheefheid geeft aan dat de staart zich aan de linkerkant van de verdeling bevindt, die zich uitstrekt naar meer negatieve waarden.
- Een positieve scheefheid geeft aan dat de staart zich aan de rechterkant van de verdeling bevindt, die zich uitstrekt naar meer positieve waarden.
- Een waarde nul geeft aan dat er geen asymmetrie in de verdeling is, wat betekent dat de verdeling perfect symmetrisch is.
Kurtosis is een maatstaf voor de vraag of een verdeling zwaar of lichtstaartig is vergeleken met eennormale verdeling .
- De kurtosis van een normale verdeling is 3.
- Als een bepaalde verdeling een kurtosis van minder dan 3 heeft, wordt er gesproken van playkurtic , wat betekent dat deze de neiging heeft om minder en minder extreme uitschieters te produceren dan de normale verdeling.
- Als een bepaalde verdeling een kurtosis groter dan 3 heeft, wordt er gezegd dat deze leptokurtisch is, wat betekent dat deze de neiging heeft om meer uitschieters te produceren dan de normale verdeling.
Opmerking: Sommige formules (Fisher-definitie) trekken 3 af van de kurtosis om vergelijking met de normale verdeling te vergemakkelijken. Met behulp van deze definitie zou een verdeling een grotere kurtosis hebben dan een normale verdeling als deze een kurtosis-waarde groter dan 0 had.
In deze tutorial wordt uitgelegd hoe u zowel de scheefheid als de kurtosis van een bepaalde dataset in Python kunt berekenen.
Voorbeeld: scheefheid en afvlakking in Python
Stel dat we de volgende dataset hebben:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Om de voorbeeldscheefheid en kurtosis van deze gegevensset te berekenen, kunnen we de functies skew() en kurt() uit de Scipy Stata-bibliotheek gebruiken met de volgende syntaxis:
- bias (reeks waarden, bias = false)
- kurt (reeks waarden, bias = false)
We gebruiken het argument bias=False om de scheefheid en kurtosis van de steekproef te berekenen, in tegenstelling tot de scheefheid van de populatie en kurtosis.
Hier leest u hoe u deze functies kunt gebruiken voor onze specifieke dataset:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
De scheefheid blijkt 0,032697 te zijn en de kurtosis blijkt 0,118157 te zijn.
Dit betekent dat de verdeling enigszins positief scheef is en meer waarden in de staarten heeft vergeleken met een normale verdeling.
Aanvullende informatiebron: scheefheids- en kurtosiscalculator
U kunt de scheefheid voor een bepaalde gegevensset ook berekenen met behulp van de Statistical Skewness and Kurtosis Calculator , die automatisch de scheefheid en kurtosis voor een bepaalde gegevensset berekent.