R'de goldfeld-quandt testi nasıl yapılır?


Goldfeld-Quandt testi, bir regresyon modelinde heteroskedastisitenin mevcut olup olmadığını belirlemek için kullanılır.

Heteroskedastisite, bir regresyon modelinde bir yanıt değişkeninin farklı seviyelerindeki artıkların eşit olmayan dağılımını ifade eder.

Değişen varyans mevcutsa bu,doğrusal regresyonun, artıkların yanıt değişkeninin her seviyesinde eşit şekilde dağıldığı yönündeki temel varsayımlarından birini ihlal eder.

Bu eğitimde, belirli bir regresyon modelinde değişen varyansın mevcut olup olmadığını belirlemek için R’de Goldfeld-Quandt testinin nasıl gerçekleştirileceğine ilişkin adım adım bir örnek sunulmaktadır.

1. Adım: Bir regresyon modeli oluşturun

İlk olarak, R’de yerleşik mtcars veri kümesini kullanarak çoklu doğrusal regresyon modeli oluşturacağız:

 #fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Adım 2: Goldfeld-Quandt testini gerçekleştirin

Daha sonra, değişen varyansın mevcut olup olmadığını belirlemek amacıyla Goldfeld-Quandt testini gerçekleştirmek için lmtest paketindeki gqtest() fonksiyonunu kullanacağız.

Bu işlev aşağıdaki sözdizimini kullanır:

gqtest(model, sıralamaya göre, veriler, kesir)

Altın:

  • model: lm() komutu tarafından oluşturulan doğrusal regresyon modeli.
  • order.by: modelin tahmin değişken(ler)i.
  • veri: Veri kümesinin adı.
  • kesir*: veri kümesinden çıkarılacak merkezi gözlemlerin sayısı.

*Goldfeld-Quandt testi, veri setinin merkezinde yer alan bir dizi gözlemi kaldırarak ve ardından artıkların dağılımının, veri setlerinin her iki tarafında yer alan sonuçta ortaya çıkan iki veri setinden farklı olup olmadığını test ederek çalışır. Merkezi gözlemler.

Genellikle toplam gözlemlerin yaklaşık %20’sini kaldırmayı seçeriz. Bu durumda mtcars’ın toplamda 32 gözlemi vardır, dolayısıyla merkezi 7 gözlemi kaldırmayı seçebiliriz:

 #load lmtest library
library(lmtest)

#perform the Goldfeld Quandt test
gqtest(model, order.by = ~disp+hp, data = mtcars, fraction = 7)

	Goldfeld-Quandt test

data: model
GQ = 1.0316, df1 = 10, df2 = 9, p-value = 0.486
alternative hypothesis: variance increases from segment 1 to 2

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • Test istatistiği 1,0316’dır .
  • Karşılık gelen p değeri 0,486’dır .

Goldfeld-Quandt testi aşağıdaki boş ve alternatif hipotezleri kullanır:

  • Boş (H 0 ) : Homoskedasticity mevcut.
  • Alternatif ( HA ): Değişken varyans mevcut.

P değeri 0,05’ten küçük olmadığından sıfır hipotezini reddedemiyoruz. Regresyon modelinde heteroskedastisitenin mevcut olduğunu iddia edecek yeterli kanıtımız yok.

Sonra ne yapacağız

Goldfeld-Quandt testinin boş hipotezini reddetmezseniz, bu durumda heteroskedastisite mevcut değildir ve orijinal regresyonun sonucunu yorumlamaya devam edebilirsiniz.

Ancak sıfır hipotezini reddederseniz bu, verilerde heteroskedastisitenin mevcut olduğu anlamına gelir. Bu durumda regresyon çıktı tablosunda görüntülenen standart hatalar güvenilir olmayabilir.

Bu sorunu çözmenin birkaç yaygın yolu vardır:

1. Yanıt değişkenini dönüştürün.

Yanıt değişkeni üzerinde bir dönüşüm gerçekleştirmeyi deneyebilirsiniz; örneğin yanıt değişkeninin günlüğünü, karekökünü veya küp kökünü alabilirsiniz. Genellikle bu, değişen varyansın ortadan kalkmasına neden olabilir.

2. Ağırlıklı regresyonu kullanın.

Ağırlıklı regresyon, her veri noktasına, uydurulan değerin varyansına dayalı olarak bir ağırlık atar. Temel olarak bu, daha yüksek varyansa sahip veri noktalarına düşük ağırlık vererek bunların kalan karelerini azaltır.

Uygun ağırlıklar kullanıldığında ağırlıklı regresyon değişen varyans problemini ortadan kaldırabilir.

Ek kaynaklar

R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
White’ın testi R’de nasıl yapılır?
R’de Breusch-Pagan testi nasıl yapılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir