Sas တွင် proc glmselect ကြေညာချက်ကိုအသုံးပြုနည်း


ဖြစ်နိုင်ချေရှိသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များစာရင်းကို အခြေခံ၍ အကောင်းဆုံးဆုတ်ယုတ်မှုပုံစံကို ရွေးချယ်ရန် SAS ရှိ PROC GLMSELECT ကြေညာချက်ကို သင်အသုံးပြုနိုင်ပါသည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤဖော်ပြချက်ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- မော်ဒယ်ရွေးချယ်မှုအတွက် SAS တွင် PROC GLMSELECT ကို အသုံးပြုနည်း

စာကျက်ချိန် (၁) နာရီကြာ၊ (၂) ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲများ နှင့် (၃) ကျောင်းသားများ၏ နောက်ဆုံးတန်း စာမေးပွဲကို ခန့်မှန်းရန် ကျား/မ၊

ပထမဦးစွာ၊ ကျောင်းသား 20 အတွက် ဤအချက်အလက်ပါရှိသော ဒေတာအတွဲကို ဖန်တီးရန် အောက်ပါကုဒ်ကို အသုံးပြုပါမည်။

 /*create dataset*/
data exam_data;
    input hours prep_exams gender $score;
    datalines ;
1 1 0 76
2 3 1 78
2 3 0 85
4 5 0 88
2 2 0 72
1 2 1 69
5 1 1 94
4 1 0 94
2 0 1 88
4 3 0 92
4 4 1 90
3 3 1 75
6 2 1 96
5 4 0 90
3 4 0 82
4 4 1 85
6 5 1 99
2 1 0 83
1 0 1 62
2 1 0 76
;
run ;

/*view dataset*/
proc print data =exam_data;

ထို့နောက်၊ ကျွန်ုပ်တို့သည် အကောင်းဆုံးဆုတ်ယုတ်မှုပုံစံကိုထုတ်လုပ်ပေးသည့် ကြိုတင်ခန့်မှန်းကိန်းရှင်များ၏ အစုခွဲများကိုခွဲခြားသတ်မှတ်ရန် PROC GLMSELECT ကြေညာချက်ကို အသုံးပြုပါမည်။

 /*perform model selection*/
proc glmselect data =exam_data;
    classgender ;
    model score = hours prep_exams gender;
run ;

မှတ်ချက် – ၎င်းသည် အမျိုးအစားခွဲခြားနိုင်သော ကိန်းရှင်ဖြစ်သောကြောင့် အတန်း ထုတ်ပြန်ချက်တွင် ကျား၊မကို ကျွန်ုပ်တို့ ထည့်သွင်းထားသည်။

အထွက်ရှိဇယား၏ပထမအုပ်စုသည် GLMSELECT လုပ်ထုံးလုပ်နည်း၏ခြုံငုံသုံးသပ်ချက်ကိုပြသသည်-

Model မှ variable များကို ထည့်သွင်းခြင်း သို့မဟုတ် ဖယ်ရှားခြင်းအား ရပ်တန့်ရန် အသုံးပြုသော စံသတ်မှတ်ချက်မှာ Schwarz အချက်အလက်စံသတ်မှတ်ချက် ဖြစ်သည့် SBC ဖြစ်ပြီး၊ တစ်ခါတစ်ရံတွင် Bayesian သတင်းအချက်အလက်စံနှုန်း ဟု ခေါ်တွင်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

အခြေခံအားဖြင့်၊ PROC GLMSELECT ထုတ်ပြန်ချက်သည် “ အကောင်းဆုံး” မော်ဒယ်ဟု ယူဆထားသည့် အနိမ့်ဆုံး SBC တန်ဖိုးရှိသော မော်ဒယ်ကို ရှာတွေ့သည်အထိ မော်ဒယ်မှ ကိန်းရှင်များကို ဆက်လက်ပေါင်းထည့်ခြင်း သို့မဟုတ် ဖယ်ရှားခြင်းတို့ကို ဆက်လက်လုပ်ဆောင်သည်။

အောက်ပါဇယားအုပ်စုသည် အဆင့်ဆင့်ရွေးချယ်မှုပြီးဆုံးပုံကို ပြသသည်-

မူရင်းအခေါ်အဝေါ်သာရှိသော မော်ဒယ်တစ်ခုတွင် SBC တန်ဖိုး 93.4337 ရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းရှင်အဖြစ် နာရီပေါင်းထည့်ခြင်းဖြင့်၊ SBC တန်ဖိုးသည် 70.4452 သို့ ကျဆင်းသွားသည်။

မော်ဒယ်ကို မြှင့်တင်ရန် အကောင်းဆုံးနည်းလမ်းမှာ ကျားမကို ခန့်မှန်းနိုင်သောကိန်းရှင်အဖြစ် ပေါင်းထည့်ရန်ဖြစ်သော်လည်း၊ ၎င်းသည် အမှန်တကယ်အားဖြင့် SBC တန်ဖိုးကို 71.7383 သို့ တိုးမြှင့်ခဲ့သည်။

ထို့ကြောင့် နောက်ဆုံးပုံစံတွင် ကြားဖြတ်အခေါ်အဝေါ်နှင့် လေ့လာသည့်အချိန်များသာ ပါဝင်သည်။

ရလဒ်၏ နောက်ဆုံးအပိုင်းသည် ဤတပ်ဆင်ထားသော ဆုတ်ယုတ်မှုပုံစံ၏ အကျဉ်းချုပ်ကို ပြသည်-

တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုပုံစံကို ရေးသားရန် Parameter Estimates ဇယားရှိ တန်ဖိုးများကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

စာမေးပွဲရမှတ် = 67.161689 + 5.250257 (စာသင်ချိန်)

ဤမော်ဒယ်သည် ဒေတာနှင့် မည်မျှ ကိုက်ညီကြောင်း ကျွန်ုပ်တို့အား ပြောပြသည့် အမျိုးမျိုးသော မက်ထရစ်များကို ကျွန်ုပ်တို့လည်း တွေ့မြင်နိုင်သည်-

R-Square တန်ဖိုးသည် ဖြေဆိုထားသည့် နာရီအရေအတွက်နှင့် ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်အလိုက် ရှင်းပြနိုင်သည့် စာမေးပွဲရမှတ်များတွင် ကွဲလွဲမှုရာခိုင်နှုန်းကို ပြောပြသည်။

ဤကိစ္စတွင်၊ စာမေးပွဲရမှတ်များ ကွဲလွဲမှု၏ 72.73% ကို သင်ကြားသည့် နာရီအရေအတွက်နှင့် ကြိုတင်ပြင်ဆင်သည့် စာမေးပွဲအရေအတွက်ဖြင့် ရှင်းပြနိုင်သည်။

Root MSE တန်ဖိုးကိုလည်း သိဖို့ အသုံးဝင်ပါတယ်။ ၎င်းသည် သတိပြုမိသော တန်ဖိုးများနှင့် ဆုတ်ယုတ်မှုမျဉ်းကြား ပျမ်းမျှအကွာအဝေးကို ကိုယ်စားပြုသည်။

ဤဆုတ်ယုတ်မှုပုံစံတွင်၊ လေ့လာတွေ့ရှိထားသောတန်ဖိုးများသည် ဆုတ်ယုတ်မှုမျဉ်းမှ ပျမ်းမျှယူနစ် 5.28052 ဖြင့် သွေဖည်သွားပါသည်။

မှတ်ချက်PROC GLMSELECT ဖြင့် သင်သုံးနိုင်သော ဖြစ်နိုင်ချေရှိသော အကြောင်းပြချက်များ၏ စာရင်းအပြည့်အစုံအတွက် SAS စာရွက်စာတမ်း အား ကိုးကားပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် SAS တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

SAS တွင် ရိုးရှင်းသော linear regression လုပ်ဆောင်နည်း
SAS တွင် မျဉ်းကြောင်းပြန်ဆုတ်ခြင်းများစွာကို မည်သို့လုပ်ဆောင်ရမည်နည်း။
SAS တွင် polynomial regression လုပ်နည်း
SAS တွင် logistic regression ကိုမည်သို့လုပ်ဆောင်ရမည်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်