İç içe geçmiş model nedir? (tanım & #038; örnek)
Yuvalanmış bir model, başka bir regresyon modelindeki öngörücü değişkenlerin bir alt kümesini içeren basit bir regresyon modelidir .
Örneğin, dört öngörücü değişkene dayalı olarak bir basketbolcunun attığı sayı sayısını tahmin eden aşağıdaki regresyon modeline (buna Model A diyelim) sahip olduğumuzu varsayalım:
Puanlar = β 0 + β 1 (dakika) + β 2 (yükseklik) + β 3 (konum) + β 4 (atış) + ε
Yuvalanmış bir modelin bir örneği (buna Model B diyelim), Model A’daki tahmin değişkenlerinden yalnızca ikisini içeren aşağıdaki model olabilir:
Puanlar = β 0 + β 1 (dakika) + β 2 (yükseklik) + ε
Model B’nin Model A’nın içinde yuvalandığını söyleyebiliriz çünkü Model B, Model A’daki tahmin değişkenlerinin bir alt kümesini içerir.
Ancak, üç öngörücü değişken içeren başka bir modelimiz (buna Model C diyelim) olup olmadığını düşünün:
Puanlar = β 0 + β 1 (dakika) + β 2 (yükseklik) + β 3 (serbest atışlar)
Her model, diğer modelin içermediği yordayıcı değişkenleri içerdiğinden , Model C’nin Model A’nın içinde yuvalandığını söyleyemeyiz .
İç içe modellerin önemi
Tam bir öngörücü değişkenler kümesine sahip bir modelin, bu yordayıcı değişkenlerin bir alt kümesine sahip bir modelden daha iyi bir veri kümesine uyup uyamayacağını bilmek istediğimizde, pratikte genellikle iç içe geçmiş modelleri kullanırız.
Örneğin yukarıdaki senaryoda basketbolcuların attığı sayıyı tahmin etmek için oynanan dakika, boy, pozisyon ve şutları kullanarak kapsamlı bir model uydurabiliriz.
Ancak pozisyonun ve şut denemelerinin alınan sayıları çok iyi tahmin edemeyeceğinden şüphelenebiliriz.
Böylece, atılan sayıları tahmin etmek için yalnızca oynanan dakikaları ve atışları kullanan iç içe geçmiş bir model uydurabiliriz.
Daha sonra istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için iki modeli karşılaştırabiliriz.
Modeller arasında anlamlı bir fark yoksa, modeli önemli ölçüde iyileştirmediği için tahmin değişkenleri olarak denenen pozisyon ve şutları kaldırabiliriz.
İç içe geçmiş modeller nasıl ayrıştırılır
Yuvalanmış bir modelin “tam” bir modelden önemli ölçüde farklı olup olmadığını belirlemek için genellikle aşağıdaki boş ve alternatif hipotezleri kullanan bir olasılık oranı testi gerçekleştiririz:
H 0 : Tam model ve iç içe geçmiş model verilere eşit derecede uyum sağlar. Bu nedenle iç içe modeli kullanmalısınız .
H A : Tam model, verilere iç içe geçmiş modelden önemli ölçüde daha iyi uyuyor. Bu nedenle şablonun tamamını kullanmanız gerekir.
Olabilirlik oranı testi, bir Ki-kare testi istatistiği ve buna karşılık gelen p değeri üretir.
Testin p değeri belirli bir anlamlılık düzeyinin (örneğin 0,05) altındaysa, sıfır hipotezini reddedebilir ve tam modelin önemli ölçüde daha iyi bir uyum sağladığı sonucuna varabiliriz.
Aşağıdaki eğitimlerde R ve Python kullanılarak olasılık oranı testinin nasıl gerçekleştirileceği açıklanmaktadır: