Python'da çarpıklık ve basıklık nasıl hesaplanır
İstatistikte çarpıklık ve basıklık bir dağılımın şeklini ölçmenin iki yoludur.
Çarpıklık , bir dağılımın çarpıklığının bir ölçüsüdür. Bu değer pozitif ya da negatif olabilir.
- Negatif çarpıklık, kuyruğun dağılımın sol tarafında olduğunu ve daha negatif değerlere doğru uzandığını gösterir.
- Pozitif bir çarpıklık, kuyruğun dağılımın sağ tarafında olduğunu ve daha pozitif değerlere doğru uzandığını gösterir.
- Sıfır değeri, dağılımda asimetri olmadığını, yani dağılımın tamamen simetrik olduğunu gösterir.
Basıklık, bir dağılımın normal dağılıma göre ağır mı yoksa hafif kuyruklu mu olduğunun ölçüsüdür.
- Normal dağılımın basıklığı 3’tür.
- Belirli bir dağılımın basıklığı 3’ten küçükse buna playkurtic denir, bu da normal dağılıma göre giderek daha az uç değerler üretme eğiliminde olduğu anlamına gelir.
- Belirli bir dağılımın basıklığı 3’ten büyükse buna leptokurtik denir, bu da normal dağılımdan daha fazla aykırı değer üretme eğiliminde olduğu anlamına gelir.
Not: Bazı formüller (Fisher tanımı), normal dağılımla karşılaştırmayı kolaylaştırmak için basıklıktan 3 çıkarır. Bu tanımı kullanarak, basıklık değeri 0’dan büyük olan bir dağılım normal dağılıma göre daha büyük basıklığa sahip olacaktır.
Bu eğitimde Python’da belirli bir veri kümesinin hem çarpıklığının hem de basıklığının nasıl hesaplanacağı açıklanmaktadır.
Örnek: Python’da Çarpıklık ve Düzleştirme
Aşağıdaki veri setine sahip olduğumuzu varsayalım:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Bu veri kümesinin örnek çarpıklığını ve basıklığını hesaplamak için Scipy Stata kütüphanesindeki skew() ve kurt() işlevlerini aşağıdaki sözdizimiyle kullanabiliriz:
- önyargı (değer dizisi, önyargı = yanlış)
- kurt (değer dizisi, önyargı = yanlış)
Popülasyon çarpıklığı ve basıklığının aksine örnek çarpıklığı ve basıklığı hesaplamak için önyargı=Yanlış argümanını kullanırız.
Bu işlevleri belirli veri kümemiz için nasıl kullanacağınız aşağıda açıklanmıştır:
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias= False ) 0.032697 #calculate sample kurtosis kurtosis(data, bias= False ) 0.118157
Çarpıklık 0,032697 ve basıklık 0,118157 olarak ortaya çıkıyor.
Bu, dağılımın biraz pozitif çarpık olduğu ve normal dağılıma göre kuyruklarda daha fazla değere sahip olduğu anlamına gelir.
Ek Kaynak: Çarpıklık ve Basıklık Hesaplayıcısı
Ayrıca belirli bir veri kümesi için çarpıklığı ve basıklığı otomatik olarak hesaplayan İstatistiksel Çarpıklık ve Basıklık Hesaplayıcı’yı kullanarak belirli bir veri kümesi için çarpıklığı hesaplayabilirsiniz .