Kısmi f testi nedir?

İle Dr.benjamin anderson Temmuz 27, 2023 Rehber 0 Yorum

Bir regresyon modeli ile aynı modelin iç içe geçmiş versiyonu arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kısmi F testi kullanılır.

Yuvalanmış bir model, genel regresyon modelinde öngörücü değişkenlerin bir alt kümesini içeren bir modeldir.

Örneğin, dört öngörücü değişkene sahip aşağıdaki regresyon modeline sahip olduğumuzu varsayalım:

Y = β ₀ + β ₁ x ₁ + β ₂ x ₂ + β ₃ x ₃ + β ₄ x ₄ + ε

İç içe geçmiş bir modelin bir örneği, orijinal tahmin değişkenlerinden yalnızca ikisini içeren aşağıdaki model olabilir:

Y = β ₀ + β ₁ x ₁ + β ₂ x ₂ + ε

Bu iki modelin önemli ölçüde farklı olup olmadığını belirlemek için kısmi bir F testi yapabiliriz.

Kısmi F testi: temel bilgiler

Kısmi bir F testi aşağıdaki F testi istatistiğini hesaplar:

F = (( _{Azaltılmış} RSS – _Tam RSS)/p) / ( _Tam RSS /nk)

Altın:

_{Azaltılmış} RSS : İndirgenmiş (yani “iç içe”) modelin kalan kareler toplamı.
RSS _dolu : Tam modelin kalan kareleri toplamı.
p: tam modelden kaldırılan tahmincilerin sayısı.
n: veri setindeki toplam gözlem sayısı.
k: Tam modeldeki katsayıların sayısı (kesme noktası dahil).

Tam model için artık kareler toplamının her zaman daha küçük olacağını unutmayın, çünkü tahmin edicilerin eklenmesi her zaman hatada bir miktar azalmaya yol açacaktır.

Dolayısıyla kısmi bir F testi, esas olarak, tam modelden çıkardığınız tahmin grubunun gerçekten yararlı olup olmadığını ve tam modele dahil edilmesi gerekip gerekmediğini test eder.

Bu test aşağıdaki boş ve alternatif hipotezleri kullanır:

H ₀ : Tam modelden çıkarılan tüm katsayılar sıfırdır.

H _A : Modelin tamamından çıkarılan katsayılardan en az biri sıfırdan farklı.

F testi istatistiğine karşılık gelen p değeri belirli bir anlamlılık düzeyinin (örneğin 0,05) altındaysa, boş hipotezi reddedebilir ve tam modelden çıkarılan katsayılardan en az birinin anlamlı olduğu sonucuna varabiliriz.

Kısmi F testi: bir örnek

Pratikte kısmi F testi gerçekleştirmek için aşağıdaki adımları kullanırız:

1. Tam regresyon modelini takın ve RSS’yi _{tam olarak} hesaplayın.

2. İç içe regresyon modelini yerleştirin ve _{azaltılmış} RSS’yi hesaplayın.

3. Modelleri karşılaştırmak için gereken F testi istatistiğini üretecek olan tam ve azaltılmış modeli karşılaştırmak için bir ANOVA gerçekleştirin.

Örneğin, aşağıdaki kod, yerleşik mtcars veri kümesindeki verileri kullanarak aşağıdaki iki regresyon modelinin R’ye nasıl sığdırılacağını gösterir:

Tam model: mpg = β ₀ + β ₁ mevcut + β ₂ karbonhidrat + β ₃ hp + β ₄ silindir

Model: mpg = β ₀ + β ₁ mevcut + β ₂ karbonhidrat

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

Sonuçtan ANOVA’nın F testi istatistiğinin 0,9113 ve buna karşılık gelen p değerinin 0,414 olduğunu görebiliriz.

Bu p değeri 0,05’ten küçük olmadığından sıfır hipotezini reddetmede başarısız olacağız. Bu, hp veya silindir öngörü değişkenlerinden herhangi birinin istatistiksel olarak anlamlı olduğunu söylemek için yeterli kanıta sahip olmadığımız anlamına gelir.

Başka bir deyişle, regresyon modeline hp ve silindirin eklenmesi model uyumunu önemli ölçüde iyileştirmemektedir.

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Kısmi F testi: temel bilgiler

Kısmi F testi: bir örnek

yazar hakkında

Dr.benjamin anderson

Yorum ekle