Kısmi f testi nedir?


Bir regresyon modeli ile aynı modelin iç içe geçmiş versiyonu arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kısmi F testi kullanılır.

Yuvalanmış bir model, genel regresyon modelinde öngörücü değişkenlerin bir alt kümesini içeren bir modeldir.

Örneğin, dört öngörücü değişkene sahip aşağıdaki regresyon modeline sahip olduğumuzu varsayalım:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

İç içe geçmiş bir modelin bir örneği, orijinal tahmin değişkenlerinden yalnızca ikisini içeren aşağıdaki model olabilir:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Bu iki modelin önemli ölçüde farklı olup olmadığını belirlemek için kısmi bir F testi yapabiliriz.

Kısmi F testi: temel bilgiler

Kısmi bir F testi aşağıdaki F testi istatistiğini hesaplar:

F = (( Azaltılmış RSS – Tam RSS)/p) / ( Tam RSS /nk)

Altın:

  • Azaltılmış RSS : İndirgenmiş (yani “iç içe”) modelin kalan kareler toplamı.
  • RSS dolu : Tam modelin kalan kareleri toplamı.
  • p: tam modelden kaldırılan tahmincilerin sayısı.
  • n: veri setindeki toplam gözlem sayısı.
  • k: Tam modeldeki katsayıların sayısı (kesme noktası dahil).

Tam model için artık kareler toplamının her zaman daha küçük olacağını unutmayın, çünkü tahmin edicilerin eklenmesi her zaman hatada bir miktar azalmaya yol açacaktır.

Dolayısıyla kısmi bir F testi, esas olarak, tam modelden çıkardığınız tahmin grubunun gerçekten yararlı olup olmadığını ve tam modele dahil edilmesi gerekip gerekmediğini test eder.

Bu test aşağıdaki boş ve alternatif hipotezleri kullanır:

H 0 : Tam modelden çıkarılan tüm katsayılar sıfırdır.

H A : Modelin tamamından çıkarılan katsayılardan en az biri sıfırdan farklı.

F testi istatistiğine karşılık gelen p değeri belirli bir anlamlılık düzeyinin (örneğin 0,05) altındaysa, boş hipotezi reddedebilir ve tam modelden çıkarılan katsayılardan en az birinin anlamlı olduğu sonucuna varabiliriz.

Kısmi F testi: bir örnek

Pratikte kısmi F testi gerçekleştirmek için aşağıdaki adımları kullanırız:

1. Tam regresyon modelini takın ve RSS’yi tam olarak hesaplayın.

2. İç içe regresyon modelini yerleştirin ve azaltılmış RSS’yi hesaplayın.

3. Modelleri karşılaştırmak için gereken F testi istatistiğini üretecek olan tam ve azaltılmış modeli karşılaştırmak için bir ANOVA gerçekleştirin.

Örneğin, aşağıdaki kod, yerleşik mtcars veri kümesindeki verileri kullanarak aşağıdaki iki regresyon modelinin R’ye nasıl sığdırılacağını gösterir:

Tam model: mpg = β 0 + β 1 mevcut + β 2 karbonhidrat + β 3 hp + β 4 silindir

Model: mpg = β 0 + β 1 mevcut + β 2 karbonhidrat

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

Sonuçtan ANOVA’nın F testi istatistiğinin 0,9113 ve buna karşılık gelen p değerinin 0,414 olduğunu görebiliriz.

Bu p değeri 0,05’ten küçük olmadığından sıfır hipotezini reddetmede başarısız olacağız. Bu, hp veya silindir öngörü değişkenlerinden herhangi birinin istatistiksel olarak anlamlı olduğunu söylemek için yeterli kanıta sahip olmadığımız anlamına gelir.

Başka bir deyişle, regresyon modeline hp ve silindirin eklenmesi model uyumunu önemli ölçüde iyileştirmemektedir.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir