Cara melakukan uji rasio kemungkinan di r
Uji rasio kemungkinan membandingkan kesesuaian dua model regresi bertingkat.
Model bersarang hanyalah model yang berisi subkumpulan variabel prediktor dalam model regresi keseluruhan.
Misalnya, kita memiliki model regresi berikut dengan empat variabel prediktor:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
Contoh model bertingkat adalah model berikut yang hanya memiliki dua variabel prediktor asli:
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
Untuk mengetahui apakah kedua model ini berbeda secara signifikan, kita dapat melakukan uji rasio kemungkinan yang menggunakan hipotesis nol dan hipotesis alternatif berikut:
H 0 : Model lengkap dan model tersarang sama-sama cocok dengan data. Jadi, Anda harus menggunakan model bersarang .
H A : Model lengkap lebih cocok dengan data dibandingkan model tersarang. Jadi harus menggunakan template yang lengkap .
Jika nilai p dari pengujian tersebut berada di bawah tingkat signifikansi tertentu (misalnya 0,05), maka kita dapat menolak hipotesis nol dan menyimpulkan bahwa model lengkap memberikan kesesuaian yang jauh lebih baik.
Contoh berikut menunjukkan cara melakukan uji rasio kemungkinan di R.
Contoh: Uji rasio kemungkinan di R
Kode berikut menunjukkan cara menyesuaikan dua model regresi berikut di R menggunakan data dari kumpulan data mtcars bawaan:
Model lengkap: mpg = β 0 + β 1 tersedia + β 2 karbohidrat + β 3 hp + β 4 silinder
Model: mpg = β 0 + β 1 tersedia + β 2 karbohidrat
Kita akan menggunakan fungsi lrtest() dari paket lmtest untuk melakukan uji rasio kemungkinan pada dua model berikut:
library (lmtest) #fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform likelihood ratio test for differences in models lrtest(model_full, model_reduced) Likelihood ratio test Model 1: mpg ~ disp + carb + hp + cyl Model 2: mpg ~ available + carb #Df LogLik Df Chisq Pr(>Chisq) 1 6 -77.558 2 4 -78.603 -2 2.0902 0.3517
Dari hasil tersebut, kita dapat melihat bahwa statistik uji chi-square adalah 2,0902 dan nilai p-value yang sesuai adalah 0,3517 .
Karena nilai p ini tidak kurang dari 0,05, kita akan gagal menolak hipotesis nol.
Artinya, model lengkap dan model tersarang sama-sama cocok dengan data. Oleh karena itu kita harus menggunakan model bersarang, karena variabel prediktor tambahan dalam model lengkap tidak memberikan peningkatan kecocokan yang signifikan.
Kami kemudian dapat melakukan uji rasio kemungkinan lainnya untuk menentukan apakah model dengan satu variabel prediktor berbeda secara signifikan dari model dengan kedua prediktor:
library (lmtest) #fit full model model_full <- lm(mpg ~ disp + carb, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp, data = mtcars) #perform likelihood ratio test for differences in models lrtest(model_full, model_reduced) Likelihood ratio test Model 1: mpg ~ available + carb Model 2: mpg ~ available #Df LogLik Df Chisq Pr(>Chisq) 1 4 -78.603 2 3 -82.105 -1 7.0034 0.008136 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dari hasil tersebut terlihat bahwa p-value uji rasio kemungkinan adalah 0,008136 . Karena angka ini kurang dari 0,05, kami menolak hipotesis nol.
Dengan demikian, kita dapat menyimpulkan bahwa model dua prediktor memberikan peningkatan kecocokan yang signifikan dibandingkan model prediktor tunggal.
Jadi, model terakhir kita adalah:
mpg = β 0 + β 1 tersedia + β 2 karbohidrat
Sumber daya tambahan
Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Bagaimana menafsirkan kode makna di R