Apa itu model bersarang? (definisi & #038; contoh)
Model bersarang hanyalah model regresi yang berisi subkumpulan variabel prediktor dalam model regresi lain.
Misalnya, kita mempunyai model regresi berikut (sebut saja Model A) yang memprediksi jumlah poin yang dicetak oleh seorang pemain bola basket berdasarkan empat variabel prediktor:
Poin = β 0 + β 1 (menit) + β 2 (tinggi) + β 3 (posisi) + β 4 (tembakan) + ε
Contoh model bertingkat (sebut saja Model B) adalah model berikut yang hanya memiliki dua variabel prediktor dari Model A:
Poin = β 0 + β 1 (menit) + β 2 (tinggi) + ε
Kita dapat mengatakan bahwa Model B bersarang di dalam Model A karena Model B berisi subset variabel prediktor dari Model A.
Namun, pertimbangkan jika kita memiliki model lain (sebut saja Model C) yang berisi tiga variabel prediktor:
Poin = β 0 + β 1 (menit) + β 2 (tinggi) + β 3 (percobaan lemparan bebas)
Kami tidak akan mengatakan bahwa Model C dimasukkan ke dalam Model A karena setiap model berisi variabel prediktor yang tidak terdapat dalam model lainnya.
Pentingnya model bersarang
Kita sering menggunakan model bertingkat dalam praktiknya ketika kita ingin mengetahui apakah model dengan kumpulan variabel prediktor lengkap dapat lebih cocok dengan kumpulan data dibandingkan model dengan subkumpulan variabel prediktor tersebut.
Misalnya, dalam skenario di atas, kita dapat memasukkan model komprehensif menggunakan menit bermain, tinggi badan, posisi, dan upaya tembakan untuk memprediksi jumlah poin yang dicetak oleh pemain bola basket.
Namun, kami mungkin curiga bahwa posisi dan percobaan tembakan mungkin tidak memprediksi poin dengan baik.
Oleh karena itu, kami dapat menyesuaikan model bertingkat yang hanya menggunakan menit bermain dan nada untuk memprediksi poin yang dicetak.
Kami kemudian dapat membandingkan kedua model untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik.
Jika tidak ada perbedaan yang signifikan antar model, kita dapat menghapus percobaan posisi dan tembakan sebagai variabel prediktor karena tidak meningkatkan model secara signifikan.
Cara mengurai model bersarang
Untuk menentukan apakah model bertingkat berbeda secara signifikan dari model “penuh”, kami biasanya melakukan uji rasio kemungkinan yang menggunakan hipotesis nol dan hipotesis alternatif berikut:
H 0 : Model lengkap dan model tersarang sama-sama cocok dengan data. Jadi, Anda harus menggunakan model bersarang .
H A : Model lengkap lebih cocok dengan data dibandingkan model tersarang. Jadi harus menggunakan template yang lengkap .
Uji rasio kemungkinan menghasilkan statistik uji Chi-kuadrat dan nilai p yang sesuai.
Jika nilai p dari pengujian tersebut berada di bawah tingkat signifikansi tertentu (misalnya 0,05), maka kita dapat menolak hipotesis nol dan menyimpulkan bahwa model lengkap memberikan kesesuaian yang jauh lebih baik.
Tutorial berikut menjelaskan cara melakukan uji rasio kemungkinan menggunakan R dan Python: