Python'da jarque-bera testi nasıl yapılır
Jarque-Bera testi, örnek verilerin normal dağılıma karşılık gelen çarpıklık ve basıklık gösterip göstermediğini belirleyen bir uyum iyiliği testidir.
Jarque-Bera test istatistiği her zaman pozitif bir sayıdır ve sıfırdan ne kadar uzaksa, örnek verilerin normal bir dağılım izlemediğine dair o kadar fazla kanıt vardır.
Bu eğitimde Python’da Jarque-Bera testinin nasıl gerçekleştirileceği açıklanmaktadır.
Python’da Jarque-Bera testi nasıl yapılır
Python’da bir Jarque-Bera testi gerçekleştirmek için Scipy kütüphanesindeki aşağıdaki sözdizimini kullanan jarque_bera işlevini kullanabilirsiniz:
jarque_bera(x)
Altın:
- x: gözlem tablosu
Bu fonksiyon bir test istatistiği ve buna karşılık gelen bir p değeri döndürür.
örnek 1
Normal dağılıma uygun 5.000 değerden oluşan bir liste üzerinde Jarque-Bera testi yaptığımızı varsayalım:
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a standard normal distribution np.random.seed(0) data = np.random.normal(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=1.2287, pvalue=0.54098)
Test istatistiği 1,2287’dir ve karşılık gelen p değeri 0,54098’dir . Bu p değeri 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz. Bu verilerin normal dağılımdan önemli ölçüde farklı çarpıklık ve basıklık sergilediğini söyleyecek yeterli kanıtımız yok.
Ürettiğimiz veriler normal dağılıma sahip 5.000 rastgele değişkenden oluştuğu için bu sonuç şaşırtıcı olmasa gerek.
Örnek 2
Şimdi, tekdüze bir dağılım izleyen 5.000 değerden oluşan bir liste üzerinde Jarque-Bera testi yaptığımızı varsayalım:
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a uniform distribution np.random.seed(0) data = np.random.uniform(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=300.1043, pvalue=0.0)
Test istatistiği 300.1043’tür ve buna karşılık gelen p değeri 0,0’dır . Bu p değeri 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz. Dolayısıyla, bu verilerin normal dağılımdan önemli ölçüde farklı çarpıklık ve basıklık sergilediğini iddia etmek için yeterli kanıtımız var.
Ürettiğimiz veriler, normal dağılımdan çok farklı bir çarpıklık ve basıklığa sahip olması gereken, tekdüze bir dağılım izleyen 5.000 rastgele değişkenden oluştuğu için bu sonuç da şaşırtıcı olmamalıdır.
Jarque-Bera testi ne zaman kullanılmalı?
Jarque-Bera testi tipik olarak diğer normallik testlerinin (Shapiro-Wilk testi gibi) güvenilmez olduğu büyük veri setleri (n > 2.000) için kullanılır.
Bu, veri setinin normal bir dağılım izlediğinin varsayıldığı bir analiz gerçekleştirilmeden önce kullanılması uygun bir testtir. Jarque-Bera testi bu varsayımın karşılanıp karşılanmadığını size söyleyebilir.