တစ်စိတ်တစ်ပိုင်း f စမ်းသပ်ခြင်းဆိုသည်မှာ အဘယ်နည်း။


တစ်စိတ်တစ်ပိုင်း F-test ကို regression model နှင့် တူညီသော model ၏ nested ဗားရှင်းကြားတွင် စာရင်းအင်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုပါသည်။

nested model သည် ယေဘုယျအားဖြင့် regression model တွင် ကြိုတင်ခန့်မှန်းနိုင်သော variable အစုအဝေးတစ်ခုပါရှိသော မော်ဒယ်တစ်ခုဖြစ်သည်။

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် ကြိုတင်ခန့်မှန်းကိန်းရှင် လေးခုပါရှိသော အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံ ရှိသည်ဆိုပါစို့။

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

nested model ၏နမူနာတစ်ခုသည် မူရင်းကြိုတင်ခန့်မှန်းကိန်းရှင်နှစ်ခုသာပါရှိသော အောက်ပါမော်ဒယ်ဖြစ်လိမ့်မည်-

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

ဤမော်ဒယ်နှစ်ခုသည် သိသာထင်ရှားစွာ ကွာခြားမှုရှိမရှိ ဆုံးဖြတ်ရန်၊ ကျွန်ုပ်တို့သည် တစ်စိတ်တစ်ပိုင်း F-test ကို လုပ်ဆောင်နိုင်ပါသည်။

Partial F စမ်းသပ်မှု- အခြေခံအချက်များ

တစ်စိတ်တစ်ပိုင်း F-test သည် အောက်ပါ F-test ကိန်းဂဏန်းကို တွက်ချက်သည်-

F = (( RSS လျှော့ချထားသည်Full RSS)/p) / ( RSS အပြည့်အစုံ /nk )

ရွှေ-

  • လျှော့ချထားသော RSS − လျှော့ထားသော (ဆိုလိုသည်မှာ “nested”) မော်ဒယ်၏ လေးထောင့်အကျန်များ။
  • RSS full : မော်ဒယ်အပြည့်၏ ကျန်ရှိသော ပေါင်းလဒ်။
  • p- မော်ဒယ်အပြည့်အစုံမှ ကြိုတင်ခန့်မှန်းသူအရေအတွက်ကို ဖယ်ရှားထားသည်။
  • n- ဒေတာအတွဲတွင် ကြည့်ရှုမှုစုစုပေါင်း။
  • k- မော်ဒယ်အပြည့်အစုံရှိ ကိန်းဂဏန်းများ (ကြားဖြတ်စနစ် အပါအဝင်)။

ကြိုတင်တွက်ဆမှုများကို ပေါင်းထည့်ခြင်းသည် အမှားအယွင်းအချို့ကို အမြဲလျော့ပါးစေသောကြောင့် လက်ကျန်စတုရန်း၏ကျန်ရှိသောပေါင်းလဒ်သည် မော်ဒယ်အပြည့်အစုံအတွက် အမြဲတမ်းသေးငယ်နေမည်ကို သတိပြုပါ။

ထို့ကြောင့် တစ်စိတ်တစ်ပိုင်း F-test သည် မော်ဒယ်အပြည့်အစုံမှ သင်ဖယ်ရှားလိုက်သော ခန့်မှန်းသူများအုပ်စုသည် အမှန်တကယ်အသုံးဝင်ပြီး မော်ဒယ်အပြည့်တွင် ပါဝင်သင့်သည်ဆိုသည်ကို အခြေခံအားဖြင့် စမ်းသပ်သည်။

ဤစစ်ဆေးမှုသည် အောက်ပါ null နှင့် အခြားအခြားသော အယူအဆများကို အသုံးပြုသည်-

H 0 : မော်ဒယ်အပြည့်မှ ဖယ်ထားသော coefficient အားလုံးသည် သုညဖြစ်သည်။

H A : ပြီးပြည့်စုံသော မော်ဒယ်မှ ဖယ်ရှားလိုက်သော ကိန်းဂဏန်းများထဲမှ အနည်းဆုံးတစ်ခုသည် သုညမဟုတ်ပေ။

F-test ကိန်းဂဏန်းနှင့် သက်ဆိုင်သော p-value သည် အချို့သော အရေးပါမှုအဆင့် (ဥပမာ- 0.05) အောက်တွင် ရှိနေပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်နိုင်ပြီး မော်ဒယ်အပြည့်မှ ဖယ်ထားသော အနည်းဆုံး coefficients များထဲမှ တစ်ခုသည် သိသာထင်ရှားသည်ဟု ကောက်ချက်ချနိုင်ပါသည်။

Partial F စမ်းသပ်မှု- ဥပမာတစ်ခု

လက်တွေ့တွင်၊ တစ်စိတ်တစ်ပိုင်း F စမ်းသပ်မှုပြုလုပ်ရန် အောက်ပါအဆင့်များကို ကျွန်ုပ်တို့အသုံးပြုသည်-

1. အပြည့်အဝ ဆုတ်ယုတ်မှု မော်ဒယ်ကို ဖြည့်ပြီး RSS အပြည့်အစုံ ကို တွက်ချက်ပါ။

2. nested regression model ကို အံကိုက်လုပ်ပြီး လျှော့ RSS ကို တွက်ချက်ပါ။

3. မော်ဒယ်များနှင့် နှိုင်းယှဉ်ရန် လိုအပ်သော F-test ကိန်းဂဏန်းကို ထုတ်ပေးမည့် အပြည့်အဝနှင့် လျှော့ချထားသော မော်ဒယ်ကို နှိုင်းယှဉ်ရန် ANOVA တစ်ခုကို လုပ်ဆောင်ပါ။

ဥပမာအားဖြင့်၊ အောက်ပါကုဒ်သည် built-in mtcars dataset မှဒေတာကို အသုံးပြု၍ R ရှိ အောက်ဖော်ပြပါ ဆုတ်ယုတ်မှုပုံစံနှစ်ခုနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ပြသည်-

မော်ဒယ်အပြည့်အစုံ- mpg = β 0 + β 1 ရနိုင်သည် + β 2 carb + β 3 hp + β 4 cyl

မော်ဒယ်- စိုင်းစိုင်းခမ်းလှိုင် = β 0 + β 1 ရရှိနိုင်သော + β 2 ကာဗိုဟိုက်ဒရိတ်

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

ရလဒ်မှ၊ ANOVA ၏ F စမ်းသပ်မှုစာရင်းအင်းသည် 0.9113 ဖြစ်ပြီး သက်ဆိုင်ရာ p-value သည် 0.414 ဖြစ်သည်ကို ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။

ဤ p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်မည်မဟုတ်ပါ။ ဆိုလိုသည်မှာ hp သို့မဟုတ် cyl ခန့်မှန်းပေးသည့်ကိန်းရှင်များသည် စာရင်းအင်းအရ သိသာထင်ရှားသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထားမရှိဟု ဆိုလိုပါသည်။

တစ်နည်းဆိုရသော်၊ regression model သို့ hp နှင့် cyl ကို ပေါင်းထည့်ခြင်းသည် model fit ကို သိသိသာသာ တိုးတက်စေခြင်း မရှိပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်