R တွင်ဖြစ်နိုင်ခြေအချိုးစမ်းသပ်မှုပြုလုပ်နည်း
ဖြစ်နိုင်ခြေအချိုးစမ်းသပ်မှုသည် nested regression မော်ဒယ်နှစ်ခု၏ အံဝင်ခွင်ကျရှိမှုကို နှိုင်းယှဉ်သည်။
nested model သည် ယေဘုယျအားဖြင့် regression model တွင် ကြိုတင်ခန့်မှန်းနိုင်သော variable အစုအဝေးတစ်ခုပါရှိသော မော်ဒယ်တစ်ခုဖြစ်သည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင် လေးခုပါရှိသော အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံ ရှိသည်ဆိုပါစို့။
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
nested model ၏နမူနာတစ်ခုသည် မူရင်းကြိုတင်ခန့်မှန်းကိန်းရှင်နှစ်ခုသာပါရှိသော အောက်ပါမော်ဒယ်ဖြစ်လိမ့်မည်-
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
ဤမော်ဒယ်နှစ်ခုသည် သိသိသာသာကွဲပြားခြင်းရှိမရှိ ဆုံးဖြတ်ရန်၊ အောက်ပါ null နှင့် အခြားအခြားသော ယူဆချက်များကို အသုံးပြုသည့် ဖြစ်နိုင်ခြေအချိုးစမ်းသပ်မှုတစ်ခုကို လုပ်ဆောင်နိုင်သည်-
H 0 : မော်ဒယ်အပြည့်အစုံနှင့် nested မော်ဒယ်သည် ဒေတာကို အညီအမျှ ကောင်းစွာ လိုက်ဖက်ပါသည်။ ဒါကြောင့် nested model ကိုသုံး သင့်ပါတယ်။
H A : မော်ဒယ်အပြည့်အစုံသည် nested မော်ဒယ်ထက် ဒေတာကို သိသိသာသာ ကိုက်ညီပါသည်။ ဒါကြောင့် template အပြည့်အစုံကို သုံး ရပါမယ်။
အကယ်၍ စမ်းသပ်မှု၏ p-တန်ဖိုးသည် အချို့သော အရေးပါမှုအဆင့် (ဥပမာ 0.05) အောက်တွင် ရှိနေပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်နိုင်ပြီး မော်ဒယ်အပြည့်အစုံသည် သိသိသာသာ ပိုမိုကောင်းမွန်သော ကိုက်ညီမှုရှိကြောင်း ကောက်ချက်ချနိုင်ပါသည်။
အောက်ဖော်ပြပါ ဥပမာသည် R တွင် ဖြစ်နိုင်ခြေအချိုးစစ်ဆေးမှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။
ဥပမာ- R တွင် ဖြစ်နိုင်ခြေအချိုးစမ်းသပ်မှု
အောက်ဖော်ပြပါ ကုဒ်သည် တပ်ဆင်ထားသော mtcars ဒေတာအတွဲမှ ဒေတာကို အသုံးပြု၍ R ရှိ အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှု မော်ဒယ်နှစ်ခုနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသသည်-
မော်ဒယ်အပြည့်အစုံ- mpg = β 0 + β 1 ရနိုင်သည် + β 2 carb + β 3 hp + β 4 cyl
မော်ဒယ်- စိုင်းစိုင်းခမ်းလှိုင် = β 0 + β 1 ရရှိနိုင်သော + β 2 ကာဗိုဟိုက်ဒရိတ်
ဤမော်ဒယ်နှစ်ခုတွင် ဖြစ်နိုင်ခြေအချိုးစမ်းသပ်မှုကို လုပ်ဆောင်ရန် lmtest အထုပ်၏ lrtest() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။
library (lmtest) #fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform likelihood ratio test for differences in models lrtest(model_full, model_reduced) Likelihood ratio test Model 1: mpg ~ disp + carb + hp + cyl Model 2: mpg ~ available + carb #Df LogLik Df Chisq Pr(>Chisq) 1 6 -77.558 2 4 -78.603 -2 2.0902 0.3517
ရလဒ်မှ၊ chi-square စမ်းသပ်မှုကိန်းဂဏန်းသည် 2.0902 ဖြစ်ပြီး ဆက်စပ် p-value သည် 0.3517 ဖြစ်ကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဤ p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ကျွန်ုပ်တို့ ငြင်းပယ်မည်မဟုတ်ပါ။
ဆိုလိုသည်မှာ full model နှင့် nested model သည် data ကို တူညီစွာ ကောင်းစွာ လိုက်ဖက်ပါသည်။ ထို့ကြောင့် မော်ဒယ်အပြည့်အစုံရှိ ထပ်လောင်းကြိုတင်ခန့်မှန်းကိန်းရှင်များသည် အံဝင်ခွင်ကျရှိ သိသာထင်ရှားသောတိုးတက်မှုကို မပေးနိုင်သောကြောင့် ကျွန်ုပ်တို့သည် nested မော်ဒယ်ကို အသုံးပြုရပါမည်။
ထို့နောက် ခန့်မှန်းပေးသူ နှစ်ခုလုံးပါသော မော်ဒယ်နှင့် သိသိသာသာ ကွဲပြားမှုရှိမရှိ ဆုံးဖြတ်ရန် နောက်ထပ်ဖြစ်နိုင်ခြေ အချိုးစမ်းသပ်မှုကို ကျွန်ုပ်တို့ လုပ်ဆောင်နိုင်သည်-
library (lmtest) #fit full model model_full <- lm(mpg ~ disp + carb, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp, data = mtcars) #perform likelihood ratio test for differences in models lrtest(model_full, model_reduced) Likelihood ratio test Model 1: mpg ~ available + carb Model 2: mpg ~ available #Df LogLik Df Chisq Pr(>Chisq) 1 4 -78.603 2 3 -82.105 -1 7.0034 0.008136 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ရလဒ်မှ၊ ဖြစ်နိုင်ခြေအချိုးစမ်းသပ်မှု၏ p-value သည် 0.008136 ဖြစ်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ ဤကိန်းဂဏန်းသည် 0.05 ထက်နည်းသောကြောင့်၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်ပါမည်။
ထို့ကြောင့်၊ နှစ်ထပ်ဟောကိန်းထုတ်ပုံစံသည် တစ်ခုတည်း-ဟောကိန်းထုတ်သည့်ပုံစံထက် အံဝင်ခွင်ကျဖြစ်မှု သိသိသာသာ တိုးတက်လာကြောင်း ကျွန်ုပ်တို့ ကောက်ချက်ချနိုင်မည်ဖြစ်သည်။
ထို့ကြောင့် ကျွန်ုပ်တို့၏ နောက်ဆုံးပုံစံသည်-
mpg = β 0 + β 1 ရရှိနိုင်သော + β 2 ကာဗိုဟိုက်ဒရိတ်
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် အဓိပ္ပါယ်ဖွင့်ဆိုပုံ