ထောက်လှမ်းဆုတ်ယုတ်မှု၏ အယူအဆ (၆) ခု (ဥပမာများနှင့်အတူ)
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model နှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့သုံးနိုင်သော method တစ်ခုဖြစ်သည်။
မော်ဒယ်တစ်ခုအား ဒေတာအတွဲတစ်ခုနှင့် အံဝင်ခွင်ကျမဖြစ်မီ၊ logistic regression သည် အောက်ပါယူဆချက်များကို ပြုလုပ်သည်-
ယူဆချက် #1- တုံ့ပြန်မှုကိန်းရှင်သည် ဒွိစုံဖြစ်သည်။
Logistic regression သည် တုံ့ပြန်မှု variable တွင် ဖြစ်နိုင်ချေ ရလဒ်နှစ်ခုသာရှိသည်ဟု ယူဆသည်။ ဤသည်မှာ ဥပမာအချို့ဖြစ်သည်။
- ဟုတ်လားသို့မဟုတ်မဟုတ်ဘူးလား
- ကျားသို့မဟုတ်မ
- အောင်မြင်သည်ဖြစ်စေ ကျရှုံးသည်
- ရေးသည် သို့မဟုတ် မရေးထား
- ဆိုးရွားသော သို့မဟုတ် ညင်သာသော
ဤယူဆချက်ကို စစ်ဆေးနည်း- တုံ့ပြန်မှုကိန်းရှင်တွင် ဖြစ်ပေါ်သည့် ထူးခြားသောရလဒ်အရေအတွက်ကို ရိုးရိုးရှင်းရှင်း ရေတွက်ပါ။ ဖြစ်နိုင်ချေ ရလဒ် နှစ်ခုထက်ပိုပါက၊ အစား ပုံမှန် ဆုတ်ယုတ်မှုကို လုပ်ဆောင်ရန် လိုအပ်ပါသည်။
Hypothesis #2- လေ့လာတွေ့ရှိချက်များသည် သီးခြားဖြစ်သည်။
Logistic regression သည် dataset အတွင်းရှိ လေ့လာမှုများ တစ်ခုနှင့်တစ်ခု သီးခြားကင်းကွာသည်ဟု ယူဆသည်။ ဆိုလိုသည်မှာ၊ လေ့လာတွေ့ရှိချက်များသည် တူညီသောလူတစ်ဦးချင်းစီ၏ ထပ်ခါတလဲလဲ တိုင်းတာခြင်းမှ ဆင်းသက်လာခြင်း သို့မဟုတ် တစ်ခုနှင့်တစ်ခု မည်သို့မျှ ဆက်စပ်မှုမရှိသင့်ပါ။
ဤယူဆချက်အား စမ်းသပ်နည်း- ဤယူဆချက်အား စမ်းသပ်ရန် အရိုးရှင်းဆုံးနည်းလမ်းမှာ ကျန်ရှိသော အချိန်နှင့် (ဆိုလိုသည်မှာ စူးစမ်းလေ့လာမှု အစီအစဉ်) ကို ဖန်တီးပြီး ကျပန်းလမ်းကြောင်းအတိုင်း ရှိ/မရှိကို စောင့်ကြည့်လေ့လာရန် ဖြစ်ပါသည်။ ကျပန်းပုံစံ မရှိပါက ၊ ဤယူဆချက်ကို ချိုးဖောက်နိုင်သည်။
အယူအဆ နံပါတ် ၃- ရှင်းပြချက် ကိန်းရှင်များကြားတွင် ပေါင်းစပ်ဖွဲ့စည်းမှု ကွဲပြားမှုမရှိပါ။
Logistic regression သည် ရှင်းပြထားသော variable များ ကြားတွင် လေးနက်သော multicollinearity မရှိဟု ယူဆသည်။
နှိုင်းယှဥ်မှုပုံစံတွင် ထူးခြားသော သို့မဟုတ် အမှီအခိုကင်းသော အချက်အလက်များကို မပေးသည့်အတွက် နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ရှင်းလင်းချက်ကွဲလွဲချက်များသည် တစ်ခုနှင့်တစ်ခု အလွန်ဆက်စပ်နေသောအခါ Multicollinearity ဖြစ်ပေါ်သည်။ ကိန်းရှင်များကြား ဆက်စပ်မှု ဒီဂရီ လုံလောက်စွာ မြင့်မားပါက၊ ၎င်းသည် မော်ဒယ်ကို အံကိုက်နှင့် ဘာသာပြန်ဆိုရာတွင် ပြဿနာများ ဖြစ်ပေါ်စေနိုင်သည်။
ဥပမာအားဖြင့်၊ သင်သည် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် အမြင့်ဆုံးဒေါင်လိုက်ခုန်ခြင်းကို အသုံးပြု၍ ရှင်းလင်းချက်ကိန်းရှင်များအဖြစ် အောက်ပါကိန်းရှင်များကို အသုံးပြု၍ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုကို လုပ်ဆောင်လိုသည်ဆိုပါစို့။
- ကစားသမားအရွယ်အစား
- ကစားသမားအရွယ်အစား
- တစ်နေ့ကို နာရီပေါင်းများစွာ လေ့ကျင့်ခဲ့ရပါတယ်။
ဤကိစ္စတွင်၊ အရပ်မြင့်သောလူများသည် ဖိနပ်အရွယ်အစား ပိုကြီးလေ့ရှိသောကြောင့် အရပ် နှင့် ဖိနပ်အရွယ်အစားသည် အလွန်ဆက်စပ်နိုင်ဖွယ်ရှိသည်။ ဆိုလိုသည်မှာ ဆုတ်ယုတ်မှုတွင် ဤကိန်းရှင်နှစ်ခုကို ကျွန်ုပ်တို့အသုံးပြုပါက multicollinearity ပြဿနာဖြစ်နိုင်ဖွယ်ရှိသည်။
ဤယူဆချက်ကိုစစ်ဆေးနည်း- Multicollinearity ကိုရှာဖွေရန်အသုံးအများဆုံးနည်းလမ်းမှာ regression model ရှိ ခန့်မှန်းသူကိန်းရှင်များကြားဆက်စပ်မှု၏ဆက်စပ်မှုနှင့် အင်အားကိုတိုင်းတာသည့် varianance inflation factor (VIF) ကိုအသုံးပြုခြင်းဖြစ်သည်။ VIF တန်ဖိုးများကို တွက်ချက်ပုံနှင့် အဓိပ္ပါယ်ပြန်ဆိုပုံအသေးစိတ်ရှင်းပြချက်အတွက် ဤသင်ခန်းစာကို ကြည့်ပါ။
ယူဆချက် # 4- လွန်ကဲသော အစွန်းထွက်များ မရှိပါ။
Logistic regression သည် ဒေတာအစုံတွင် လွန်ကဲသော အစွန်းထွက်များ သို့မဟုတ် ဩဇာသက်ရောက်မှုရှိသော စူးစမ်းလေ့လာမှုများ မရှိဟု ယူဆသည်။
ဤယူဆချက်ကို စစ်ဆေးနည်း- ဒေတာအတွဲတစ်ခုရှိ အလွန်အကျွံအစွန်းထွက်မှုများနှင့် သြဇာကြီးမားသော စောင့်ကြည့်မှုများကို စမ်းသပ်ရန် အသုံးအများဆုံးနည်းလမ်းမှာ ရှုမြင်မှုတစ်ခုစီအတွက် Cook ၏ အကွာအဝေးကို တွက်ချက်ခြင်းဖြစ်သည်။ အကယ်၍ သာလွန်မှုများရှိနေပါက၊ (၁) ၎င်းတို့အား ဖယ်ရှားရန် သင်ရွေးချယ်နိုင်သည်၊ (၂) ၎င်းတို့ကို ပျမ်းမျှ သို့မဟုတ် အလယ်အလတ်ကဲ့သို့ တန်ဖိုးတစ်ခုဖြင့် အစားထိုးနိုင်သည်၊ သို့မဟုတ် (၃) ၎င်းတို့ကို စံနမူနာတွင် သိမ်းဆည်းထားသော်လည်း ဆုတ်ယုတ်မှုအား အစီရင်ခံသည့်အခါ ၎င်းတို့ကို မှတ်သားထားပါ။ . ရလဒ်များ။
Hypothesis #5- ရှင်းလင်းချက်ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်၏ logit အကြား မျဉ်းသားသော ဆက်နွယ်မှုရှိသည်
Logistic regression သည် explanatory variable တစ်ခုစီနှင့် response variable ၏ logit ကြားတွင် linear ဆက်နွယ်မှုရှိနေသည်ဟု ယူဆသည်။ logit ကို အောက်ပါအတိုင်း သတ်မှတ်ကြောင်း မှတ်သားပါ။
Logit(p) = log(p / (1-p)) p သည် အပြုသဘောဆောင်သောရလဒ်ဖြစ်နိုင်ခြေရှိရာ။
ဤယူဆချက်အား စမ်းသပ်နည်း- ဤယူဆချက်သည် မှန်ခြင်းရှိမရှိ သိရန် အလွယ်ဆုံးနည်းလမ်းမှာ Box-Tidwell စမ်းသပ်မှုကို အသုံးပြုခြင်းဖြစ်သည်။
ယူဆချက် #6- နမူနာအရွယ်အစားသည် လုံလောက်သည်။
Logistic regression သည် dataset ၏နမူနာအရွယ်အစားသည် တပ်ဆင်ထားသော logistic regression model မှတရားဝင်ကောက်ချက်ဆွဲရန်လုံလောက်သောကြီးမားသည်ဟုယူဆသည်။
ဤယူဆချက်အား စစ်ဆေးနည်း- လက်မ၏ စည်းမျဉ်းအရ၊ ရှင်းပြချက်တစ်ခုစီအတွက် မကြာခဏ အနည်းနှင့်အများ အနည်းဆုံး ရလဒ် ၁၀ ခု ရှိသင့်သည်။ ဥပမာအားဖြင့်၊ သင့်တွင် ရှင်းပြနိုင်သော ကိန်းရှင် 3 ခုရှိပြီး မကြာခဏ အနည်းဆုံးရလဒ်၏ ဖြစ်နိုင်ခြေမှာ 0.20 ဖြစ်ပါက သင့်တွင် အနည်းဆုံး နမူနာအရွယ်အစား (10*3) / 0.20 = 150 ရှိသင့်သည်။
Logistic Regression vs. Linear Regression
linear regression နှင့်မတူဘဲ၊ logistic regression မလိုအပ်ပါ။
- ရှင်းပြချက် ကိန်းရှင်(များ) နှင့် တုံ့ပြန်မှု ကိန်းရှင်ကြား မျဉ်းသားသော ဆက်ဆံရေး။
- မော်ဒယ်၏ အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေရန်။
- အကြွင်းအကျန်များသည် homoscedasticity ဟုခေါ်သော အဆက်မပြတ်ကွဲလွဲမှုရှိရပါမည်။
ဆက်စပ်- မျဉ်းကြောင်းဆုတ်ယုတ်မှု၏ ယူဆချက်လေးခု
ထပ်လောင်းအရင်းအမြစ်များ
4 လက်တွေ့ဘဝတွင် Logistic Regression ကိုအသုံးပြုခြင်း၏နမူနာများ
SPSS တွင် logistic regression လုပ်နည်း
Excel တွင် Logistic Regression ကို မည်သို့လုပ်ဆောင်မည်နည်း။
Stata တွင် ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်နည်း