Python'da jarque-bera testi nasıl yapılır


Jarque-Bera testi, örnek verilerin normal dağılıma karşılık gelen çarpıklık ve basıklık gösterip göstermediğini belirleyen bir uyum iyiliği testidir.

Jarque-Bera test istatistiği her zaman pozitif bir sayıdır ve sıfırdan ne kadar uzaksa, örnek verilerin normal bir dağılım izlemediğine dair o kadar fazla kanıt vardır.

Bu eğitimde Python’da Jarque-Bera testinin nasıl gerçekleştirileceği açıklanmaktadır.

Python’da Jarque-Bera testi nasıl yapılır

Python’da bir Jarque-Bera testi gerçekleştirmek için Scipy kütüphanesindeki aşağıdaki sözdizimini kullanan jarque_bera işlevini kullanabilirsiniz:

jarque_bera(x)

Altın:

  • x: gözlem tablosu

Bu fonksiyon bir test istatistiği ve buna karşılık gelen bir p değeri döndürür.

örnek 1

Normal dağılıma uygun 5.000 değerden oluşan bir liste üzerinde Jarque-Bera testi yaptığımızı varsayalım:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a standard normal distribution
np.random.seed(0)
data = np.random.normal(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=1.2287, pvalue=0.54098)

Test istatistiği 1,2287’dir ve karşılık gelen p değeri 0,54098’dir . Bu p değeri 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz. Bu verilerin normal dağılımdan önemli ölçüde farklı çarpıklık ve basıklık sergilediğini söyleyecek yeterli kanıtımız yok.

Ürettiğimiz veriler normal dağılıma sahip 5.000 rastgele değişkenden oluştuğu için bu sonuç şaşırtıcı olmasa gerek.

Örnek 2

Şimdi, tekdüze bir dağılım izleyen 5.000 değerden oluşan bir liste üzerinde Jarque-Bera testi yaptığımızı varsayalım:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a uniform distribution
np.random.seed(0)
data = np.random.uniform(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=300.1043, pvalue=0.0)

Test istatistiği 300.1043’tür ve buna karşılık gelen p değeri 0,0’dır . Bu p değeri 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz. Dolayısıyla, bu verilerin normal dağılımdan önemli ölçüde farklı çarpıklık ve basıklık sergilediğini iddia etmek için yeterli kanıtımız var.

Ürettiğimiz veriler, normal dağılımdan çok farklı bir çarpıklık ve basıklığa sahip olması gereken, tekdüze bir dağılım izleyen 5.000 rastgele değişkenden oluştuğu için bu sonuç da şaşırtıcı olmamalıdır.

Jarque-Bera testi ne zaman kullanılmalı?

Jarque-Bera testi tipik olarak diğer normallik testlerinin (Shapiro-Wilk testi gibi) güvenilmez olduğu büyük veri setleri (n > 2.000) için kullanılır.

Bu, veri setinin normal bir dağılım izlediğinin varsayıldığı bir analiz gerçekleştirilmeden önce kullanılması uygun bir testtir. Jarque-Bera testi bu varsayımın karşılanıp karşılanmadığını size söyleyebilir.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir