R'de white testi nasıl yapılır (örneklerle)


White testi, bir regresyon modelinde değişen varyansın mevcut olup olmadığını belirlemek için kullanılır.

Değişken varyans, bir regresyon modelinde bir yanıt değişkeninin farklı seviyelerindeki artıkların eşit olmayan dağılımını ifade eder; bu,doğrusal regresyonun, artıkların yanıt değişkeninin her düzeyinde eşit şekilde dağıldığı yönündeki temel varsayımlarından birini ihlal eder.

Bu eğitimde, değişen varyansın belirli bir regresyon modelinde bir sorun olup olmadığını belirlemek için R’de White testinin nasıl gerçekleştirileceği açıklanmaktadır.

Örnek: R’de beyaz testi

Bu örnekte mtcars’ın yerleşik R veri kümesini kullanarak çoklu doğrusal regresyon modelini yerleştireceğiz.

Modeli yerleştirdikten sonra, değişen varyansın mevcut olup olmadığını belirlemek amacıyla White testini gerçekleştirmek için lmtest kütüphanesindeki bptest fonksiyonunu kullanacağız.

Adım 1: Bir regresyon modeli yerleştirin.

İlk olarak, yanıt değişkeni olarak mpg’yi ve iki açıklayıcı değişken olarak disp ve hp’yi kullanarak bir regresyon modeli uygulayacağız.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Adım 2: White’ın testini gerçekleştirin.

Daha sonra, değişen varyansın mevcut olup olmadığını belirlemek amacıyla White testini gerçekleştirmek için aşağıdaki sözdizimini kullanacağız:

 #load lmtest library
library(lmtest)

#perform White's test
bptest(model, ~ disp*hp + I(disp^2) + I(hp^2), data = mtcars)

	studentized Breusch-Pagan test

data: model
BP = 7.0766, df = 5, p-value = 0.215

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • Test istatistiği X2 = 7,0766’dır .
  • Serbestlik derecesi 5’tir .
  • Karşılık gelen p değeri 0,215’tir .

White testi aşağıdaki boş ve alternatif hipotezleri kullanır:

  • Boş (H 0 ) : Homoskedasticity mevcut.
  • Alternatif ( HA ): Değişken varyans mevcut.

P değeri 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz. Regresyon modelinde heteroskedastisitenin mevcut olduğunu iddia edecek yeterli kanıtımız yok.

Sonra ne yapacağız

White testinin sıfır hipotezini reddetmeyi başaramazsanız, o zaman heteroskedastisite mevcut değildir ve orijinal regresyonun sonucunu yorumlamaya devam edebilirsiniz.

Ancak sıfır hipotezini reddederseniz bu, verilerde heteroskedastisitenin mevcut olduğu anlamına gelir. Bu durumda regresyon çıktı tablosunda görüntülenen standart hatalar güvenilir olmayabilir.

Bu sorunu çözmenin birkaç yaygın yolu vardır:

1. Yanıt değişkenini dönüştürün.

Yanıt değişkeni üzerinde bir dönüşüm gerçekleştirmeyi deneyebilirsiniz; örneğin yanıt değişkeninin günlüğünü, karekökünü veya küp kökünü alabilirsiniz. Genellikle bu, değişen varyansın ortadan kalkmasına neden olabilir.

2. Ağırlıklı regresyon kullanın.

Ağırlıklı regresyon, her veri noktasına, uydurulan değerin varyansına dayalı olarak bir ağırlık atar. Temel olarak bu, daha yüksek varyansa sahip veri noktalarına düşük ağırlık vererek bunların kalan karelerini azaltır. Uygun ağırlıklar kullanıldığında değişen varyans sorunu ortadan kaldırılabilir.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir