တစ်စိတ်တစ်ပိုင်း f စမ်းသပ်ခြင်းဆိုသည်မှာ အဘယ်နည်း။
တစ်စိတ်တစ်ပိုင်း F-test ကို regression model နှင့် တူညီသော model ၏ nested ဗားရှင်းကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုပါသည်။
nested model သည် ယေဘုယျအားဖြင့် regression model တွင် ကြိုတင်ခန့်မှန်းနိုင်သော variable အစုအဝေးတစ်ခုပါရှိသော မော်ဒယ်တစ်ခုဖြစ်သည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင် လေးခုပါရှိသော အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံ ရှိသည်ဆိုပါစို့။
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
nested model ၏နမူနာတစ်ခုသည် မူရင်းကြိုတင်ခန့်မှန်းကိန်းရှင်နှစ်ခုသာပါရှိသော အောက်ပါမော်ဒယ်ဖြစ်လိမ့်မည်-
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
ဤမော်ဒယ်နှစ်ခုသည် သိသာထင်ရှားစွာ ကွာခြားမှုရှိမရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် တစ်စိတ်တစ်ပိုင်း F-test ကို လုပ်ဆောင်နိုင်ပါသည်။
Partial F စမ်းသပ်မှု- အခြေခံအချက်များ
တစ်စိတ်တစ်ပိုင်း F-test သည် အောက်ပါ F-test ကိန်းဂဏန်းကို တွက်ချက်သည်-
F = (( RSS လျှော့ချထားသည် – Full RSS)/p) / ( RSS အပြည့်အစုံ /nk )
ရွှေ-
- လျှော့ချထားသော RSS − လျှော့ထားသော (ဆိုလိုသည်မှာ “nested”) မော်ဒယ်၏ လေးထောင့်အကျန်များ။
- RSS full : မော်ဒယ်အပြည့်၏ ကျန်ရှိသော ပေါင်းလဒ်။
- p- မော်ဒယ်အပြည့်အစုံမှ ကြိုတင်ခန့်မှန်းသူအရေအတွက်ကို ဖယ်ရှားထားသည်။
- n- ဒေတာအတွဲတွင် ကြည့်ရှုမှုစုစုပေါင်း။
- k- မော်ဒယ်အပြည့်အစုံရှိ ကိန်းဂဏန်းများ (ကြားဖြတ်စနစ် အပါအဝင်)။
ကြိုတင်တွက်ဆမှုများကို ပေါင်းထည့်ခြင်းသည် အမှားအယွင်းအချို့ကို အမြဲလျော့ပါးစေသောကြောင့် လက်ကျန်စတုရန်း၏ကျန်ရှိသောပေါင်းလဒ်သည် မော်ဒယ်အပြည့်အစုံအတွက် အမြဲတမ်းသေးငယ်နေမည်ကို သတိပြုပါ။
ထို့ကြောင့် တစ်စိတ်တစ်ပိုင်း F-test သည် မော်ဒယ်အပြည့်အစုံမှ သင်ဖယ်ရှားလိုက်သော ခန့်မှန်းသူများအုပ်စုသည် အမှန်တကယ်အသုံးဝင်ပြီး မော်ဒယ်အပြည့်တွင် ပါဝင်သင့်သည်ဆိုသည်ကို အခြေခံအားဖြင့် စမ်းသပ်သည်။
ဤစစ်ဆေးမှုသည် အောက်ပါ null နှင့် အခြားအခြားသော အယူအဆများကို အသုံးပြုသည်-
H 0 : မော်ဒယ်အပြည့်မှ ဖယ်ထားသော coefficient အားလုံးသည် သုညဖြစ်သည်။
H A : ပြီးပြည့်စုံသော မော်ဒယ်မှ ဖယ်ရှားလိုက်သော ကိန်းဂဏန်းများထဲမှ အနည်းဆုံးတစ်ခုသည် သုညမဟုတ်ပေ။
F-test ကိန်းဂဏန်းနှင့် သက်ဆိုင်သော p-value သည် အချို့သော အရေးပါမှုအဆင့် (ဥပမာ- 0.05) အောက်တွင် ရှိနေပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်နိုင်ပြီး မော်ဒယ်အပြည့်မှ ဖယ်ထားသော အနည်းဆုံး coefficients များထဲမှ တစ်ခုသည် သိသာထင်ရှားသည်ဟု ကောက်ချက်ချနိုင်ပါသည်။
Partial F စမ်းသပ်မှု- ဥပမာတစ်ခု
လက်တွေ့တွင်၊ တစ်စိတ်တစ်ပိုင်း F စမ်းသပ်မှုပြုလုပ်ရန် အောက်ပါအဆင့်များကို ကျွန်ုပ်တို့အသုံးပြုသည်-
1. အပြည့်အဝ ဆုတ်ယုတ်မှု မော်ဒယ်ကို ဖြည့်ပြီး RSS အပြည့်အစုံ ကို တွက်ချက်ပါ။
2. nested regression model ကို အံကိုက်လုပ်ပြီး လျှော့ RSS ကို တွက်ချက်ပါ။
3. မော်ဒယ်များနှင့် နှိုင်းယှဉ်ရန် လိုအပ်သော F-test ကိန်းဂဏန်းကို ထုတ်ပေးမည့် အပြည့်အဝနှင့် လျှော့ချထားသော မော်ဒယ်ကို နှိုင်းယှဉ်ရန် ANOVA တစ်ခုကို လုပ်ဆောင်ပါ။
ဥပမာအားဖြင့်၊ အောက်ပါကုဒ်သည် built-in mtcars dataset မှဒေတာကို အသုံးပြု၍ R ရှိ အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံနှစ်ခုနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသည်-
မော်ဒယ်အပြည့်အစုံ- mpg = β 0 + β 1 ရနိုင်သည် + β 2 carb + β 3 hp + β 4 cyl
မော်ဒယ်- စိုင်းစိုင်းခမ်းလှိုင် = β 0 + β 1 ရရှိနိုင်သော + β 2 ကာဗိုဟိုက်ဒရိတ်
#fit full model model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars) #fit reduced model model_reduced <- lm(mpg ~ disp + carb, data = mtcars) #perform ANOVA to test for differences in models anova(model_reduced, model_full) Analysis of Variance Table Model 1: mpg ~ available + carb Model 2: mpg ~ disp + carb + hp + cyl Res.Df RSS Df Sum of Sq F Pr(>F) 1 29 254.82 2 27 238.71 2 16.113 0.9113 0.414
ရလဒ်မှ၊ ANOVA ၏ F စမ်းသပ်မှုစာရင်းအင်းသည် 0.9113 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.414 ဖြစ်သည်ကို ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဤ p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်မည်မဟုတ်ပါ။ ဆိုလိုသည်မှာ hp သို့မဟုတ် cyl ခန့်မှန်းပေးသည့်ကိန်းရှင်များသည် စာရင်းအင်းအရ သိသာထင်ရှားသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားမရှိဟု ဆိုလိုပါသည်။
တစ်နည်းဆိုရသော်၊ regression model သို့ hp နှင့် cyl ကို ပေါင်းထည့်ခြင်းသည် model fit ကို သိသိသာသာ တိုးတက်စေခြင်း မရှိပါ။