Sas တွင် logistic regression ကိုမည်သို့လုပ်ဆောင်ရမည်နည်း
Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model နှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့သုံးနိုင်သော method တစ်ခုဖြစ်သည်။
Logistic regression သည် အောက်ပါပုံစံ၏ ညီမျှခြင်းတစ်ခုကို ရှာဖွေရန် အများဆုံးဖြစ်နိုင်ခြေ ခန့်မှန်းချက် ဟု လူသိများသော နည်းလမ်းကို အသုံးပြုသည်-
log[p(X) / (1 – p(X))] = β 0 + β 1 X 1 + β 2 X 2 + … + β p
ရွှေ-
- X j : j th ကြိုတင်ခန့်မှန်းနိုင်သောကိန်းရှင်
- β j : j th ကြိုတင်ခန့်မှန်းကိန်းရှင်အတွက် ကိန်းကိန်းကို ခန့်မှန်းခြင်း။
ညီမျှခြင်း၏ ညာဘက်ရှိ ဖော်မြူလာသည် တုံ့ပြန်မှုကိန်းရှင်သည် တန်ဖိုး 1 ကို ယူသည့် မှတ်တမ်းအပေါက်များကို ခန့်မှန်းပေးသည်။
အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် SAS ရှိ ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို မည်သို့ အံဝင်ခွင်ကျဖြစ်စေရန် ပြသထားသည်။
အဆင့် 1: ဒေတာအတွဲကို ဖန်တီးပါ။
ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် ကျောင်းသား 18 ဦးအတွက် အောက်ဖော်ပြပါ ကိန်းရှင်သုံးမျိုးပါ အချက်အလက်ပါရှိသော ဒေတာအတွဲတစ်ခုကို ဖန်တီးပါမည်။
- ကောလိပ်တစ်ခုခုသို့ လက်ခံခြင်း (1 = yes, 0 = no)
- GPA (စကေး 1 မှ 4 အထိ)
- ACT ရမှတ် (စကေး 1 မှ 36 အထိ)
/*create dataset*/ data my_data; input acceptance gpa act; datalines ; 1 3 30 0 1 21 0 2 26 0 1 24 1 3 29 1 3 34 0 3 31 1 2 29 0 1 21 1 2 21 0 1 15 1 3 32 1 4 31 1 4 29 0 1 24 1 4 29 1 3 21 1 4 34 ; run ; /*view dataset*/ proc print data =my_data;

အဆင့် 2- ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် “ လက်ခံမှု” နှင့် “ gpa” နှင့် “ ပြုမူခြင်း” တို့ကို ခန့်မှန်းသည့်ကိန်းရှင်များအဖြစ် “ လက်ခံမှု” ကို အသုံးပြု၍ ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံနှင့်ကိုက်ညီရန် proc ထောက်ပံ့ပို့ဆောင်ရေးကို အသုံးပြုပါမည်။
မှတ်ချက် – တုံ့ပြန်မှုကိန်းရှင်သည် 1 ၏တန်ဖိုးဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် SAS အတွက် လျှော့ချခြင်းကို သတ်မှတ်ရမည်ဖြစ်ပါသည်။ ပုံမှန်အားဖြင့်၊ SAS သည် တုံ့ပြန်မှုကိန်းရှင်သည် 0 တန်ဖိုးရှိလိမ့်မည်ဟူသော ဖြစ်နိုင်ခြေကို ခန့်မှန်းသည်။
/*fit logistic regression model*/
proc logistic data =my_data descending ;
model acceptance = gpa act;
run ;

ပထမဆုံး စိတ်ဝင်စားသောဇယားမှာ Model Fit Statistics ခေါင်းစဉ်ဖြစ်သည်။
ဤဇယားမှ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ AIC တန်ဘိုးကို 16.595 ဟုမြင်နိုင်သည်။ AIC တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်သည် ဒေတာနှင့် အံဝင်ခွင်ကျဖြစ်လေလေ ဖြစ်သည်။
သို့သော် AIC တန်ဖိုးကို “ ကောင်း” ဟုယူဆသည့်အရာအတွက် ကန့်သတ်ချက်မရှိပါ။ ယင်းအစား၊ ကျွန်ုပ်တို့သည် မော်ဒယ်များစွာ၏ အံဝင်ခွင်ကျဖြစ်သော ဒေတာအစုနှင့် နှိုင်းယှဉ်ရန် AIC ကို အသုံးပြုပါသည်။ AIC တန်ဖိုးအနည်းဆုံး မော်ဒယ်ကို ယေဘုယျအားဖြင့် အကောင်းဆုံးဟု ယူဆပါသည်။
စိတ်ဝင်စားဖွယ် နောက်ဇယား မှာ Global Null Hypothesis- BETA=0 ကို စမ်းသပ်ခြင်းဟု ခေါင်းစဉ်တပ်ထားသည်။
ဤဇယားမှ၊ ဆက်စပ် p-value ၏ 0.0012 ဖြင့် 13.4620 ၏ ဖြစ်နိုင်ခြေအချိုး chi-square တန်ဖိုးကို ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဤ p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ ၎င်းသည် ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံတစ်ခုလုံးသည် ကိန်းဂဏန်းအရ သိသာထင်ရှားကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် အများဆုံးဖြစ်နိုင်ခြေ ခန့်မှန်းခြေများကို ခွဲခြမ်းစိတ်ဖြာခြင်း ခေါင်းစဉ်ဖြင့် ဇယားတွင် ကိန်းဂဏန်း ခန့်မှန်းချက်များကို ပိုင်းခြားစိတ်ဖြာနိုင်ပါသည်။
ဤဇယားမှ ကျွန်ုပ်တို့သည် ကိန်းရှင်တစ်ခုစီတွင် တစ်ယူနစ်တိုးလာမှုအတွက် ကောလိပ်သို့လက်ခံခြင်း၏ မှတ်တမ်းပေါက်နှုန်းများတွင် ပျမ်းမျှပြောင်းလဲမှုကို ညွှန်ပြသည့် gpa နှင့် act အတွက် ကိန်းဂဏန်းများကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
ဥပမာအားဖြင့်:
- GPA တန်ဖိုး တစ်ယူနစ် တိုးခြင်းသည် ကောလိပ်သို့ လက်ခံခြင်း၏ မှတ်တမ်းတွင် ပျမ်းမျှ 2.9665 တိုးခြင်းနှင့် ဆက်စပ်နေသည်။
- ACT ရမှတ် တစ်ယူနစ် တိုးခြင်းသည် ကောလိပ်သို့ လက်ခံသည့် မှတ်တမ်း၏ ပျမ်းမျှ 0.1145 လျော့နည်းခြင်း နှင့် ဆက်စပ်နေသည်။
ရလဒ်ရှိ သက်ဆိုင်သော p-တန်ဖိုးများသည် ကျွန်ုပ်တို့အား လက်ခံနိုင်ခြေကို ခန့်မှန်းရာတွင် ကိန်းရှင်တစ်ခုစီသည် မည်မျှထိရောက်ကြောင်း အကြံဉာဏ်ပေးပါသည်။
- GPA P-တန်ဖိုး- 0.0679
- ACT P-တန်ဖိုး- 0.6289
GPA သည် ကောလိပ်လက်ခံမှု၏ ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ခန့်မှန်းချက်တစ်ခု ဖြစ်ပုံရပြီး ACT ရမှတ်သည် စာရင်းအင်းအရ သိသာထင်ရှားပုံမပေါ်ပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် SAS တွင် အခြားသော ဆုတ်ယုတ်မှုပုံစံများနှင့် အံဝင်ခွင်ကျဖြစ်ပုံကို ရှင်းပြထားသည်။
SAS တွင် ရိုးရှင်းသော linear regression လုပ်ဆောင်နည်း
SAS တွင် မျဉ်းကြောင်းပြန်ဆုတ်ခြင်းများစွာကို မည်သို့လုပ်ဆောင်ရမည်နည်း။