R'de jarque-bera testi nasıl yapılır


Jarque-Bera testi, örnek verilerin normal dağılıma karşılık gelen çarpıklık ve basıklık gösterip göstermediğini belirleyen bir uyum iyiliği testidir.

Jarque-Bera test istatistiği her zaman pozitif bir sayıdır ve sıfırdan uzak olması örneklem verilerinin normal dağılıma sahip olmadığını gösterir.

JB test istatistiği şu şekilde tanımlanır:

JB =[(n-k+1) / 6] * [S 2 + (0,25*(C-3) 2 )]

burada n numunedeki gözlem sayısıdır, k regresörlerin sayısıdır (regresyon bağlamında kullanılmadıysa k = 1), S numunenin çarpıklığıdır ve C numunenin basıklığıdır.

Normalliğin boş hipotezi altında JB ~

Bu eğitimde R’de Jarque-Bera testinin nasıl gerçekleştirileceği açıklanmaktadır.

R’de Jarque-Bera testi

Örnek bir veri kümesi için Jarque-Bera testi gerçekleştirmek için tseries paketini kullanabiliriz:

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 normally distributed random variables
dataset <- rnorm(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

Bu, aşağıdaki çıktıyı üretir:

Bu bize test istatistiğinin 0,67446 ve test p değerinin 0,7137 olduğunu söyler. Bu durumda verilerin normal dağıldığı yönündeki sıfır hipotezini reddedemeyiz.

Oluşturduğumuz veri seti normal dağılıma sahip 100 rastgele değişkenden oluştuğu için bu sonuç şaşırtıcı olmasa gerek.

Bunun yerine, eşit şekilde dağıtılmış 100 rastgele değişkenin listesinden oluşan bir veri kümesi oluşturup oluşturmadığımızı düşünün:

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 uniformly distributed random variables
dataset <- runif(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

Bu, aşağıdaki çıktıyı üretir:

Bu bize test istatistiğinin 8,0807 ve test p değerinin 0,01759 olduğunu söyler. Bu durumda verilerin normal dağıldığı yönündeki sıfır hipotezi reddedilir. Bu örnekteki verilerin normal dağılmadığını söyleyecek yeterli kanıtımız var.

Oluşturduğumuz veri seti düzgün bir dağılım izleyen 100 rastgele değişkenden oluştuğu için bu sonuç şaşırtıcı olmamalıdır. Sonuçta verilerin normal şekilde değil, eşit şekilde dağıtılması gerekiyor.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir