Sas တွင်ချက်ပြုတ်အကွာအဝေးကိုဘယ်လိုတွက်မလဲ။


Cook ၏ အကွာအဝေး ကို ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် သြဇာညောင်းသော စောင့်ကြည့်မှုများကို ဖော်ထုတ်ရန် အသုံးပြုသည်။

Cook ၏ အကွာအဝေးအတွက် ဖော်မြူလာမှာ-

d i = (r i 2 / p*MSE) * (h ii / (1-h ii ) 2 )

ရွှေ-

  • r i သည် i th အကြွင်းဖြစ်သည်။
  • p သည် regression model တွင် coefficients အရေအတွက်ဖြစ်သည်။
  • MSE သည် mean square error ဖြစ်သည်။
  • h ii သည် ith leverage တန်ဖိုးဖြစ်သည်။

အခြေခံအားဖြင့်၊ Cook ၏ အကွာအဝေးသည် i th observation ကို ဖယ်ရှားလိုက်သောအခါ မော်ဒယ်ပြောင်းလဲမှုအားလုံး၏ တပ်ဆင်တန်ဖိုးများ မည်မျှရှိသည်ကို တိုင်းတာသည်။

Cook ၏ အကွာအဝေး၏တန်ဖိုး ကြီးမားလေ၊ ပေးထားသော စောင့်ကြည့်မှုမှာ သြဇာပိုလေဖြစ်သည်။

ယေဘူယျအားဖြင့်၊ 4/n ထက်ကြီးသော Cook အကွာအဝေး ( n = စုစုပေါင်းလေ့လာသုံးသပ်ချက်များ) သည် ကြီးမားသောသြဇာလွှမ်းမိုးမှုရှိသည်ဟု ယူဆပါသည်။

အောက်ဖော်ပြပါ ဥပမာသည် SAS ရှိ ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ ရှုထောင့်တစ်ခုစီအတွက် Cook ၏ အကွာအဝေးကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- SAS တွင် ချက်ပြုတ်သူ၏ အကွာအဝေးကို တွက်ချက်ခြင်း။

SAS တွင် အောက်ပါဒေတာအစုံရှိသည် ဟု ယူဆကြပါစို့။

 /*create dataset*/
data my_data;
    input xy;
    datalines ;
8 41
12 42
12 39
13 37
14 35
16 39
17 45
22 46
24 39
26 49
29 55
30 57
;
run ;

/*view dataset*/
proc print data =my_data;

ဤဒေတာအတွဲအတွက် ရိုးရှင်းသောမျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို ကိုက်ညီရန် PROC REG ကို အသုံးပြုနိုင်ပြီး၊ ထို့နောက် ဆုတ်ယုတ်မှုပုံစံရှိ ရှုမြင်မှုတစ်ခုစီအတွက် Cook ၏ အကွာအဝေးကို တွက်ချက်ရန် OUTPUT ထုတ်ပြန်ချက်နှင့်အတူ COOKD ကြေညာချက်ကို အသုံးပြုပါ-

 /*fit simple linear regression model and calculate Cook's distance for each obs*/
proc reg data =my_data;
    model y=x;
    output out=cooksData cookd =cookd;
run ;

/*print Cook's distance values for each observation*/
proc print data =cooksData;

နောက်ဆုံးရလဒ်ဇယားသည် လေ့လာမှုတစ်ခုစီအတွက် Cook အကွာအဝေးနှင့်အတူ မူရင်းဒေတာအတွဲကို ပြသသည်-

ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ပထမဆုံးကြည့်ရှုမှုအတွက် Cook အကွာအဝေးသည် 0.36813 ဖြစ်သည်။
  • ဒုတိယကြည့်ရှုမှုအတွက် Cook အကွာအဝေးသည် 0.06075 ဖြစ်သည်။
  • တတိယရှုထောင့်အတွက် Cook အကွာအဝေးသည် 0.00052 ဖြစ်သည်။

နောက် … ပြီးတော့။

PROC REG လုပ်ထုံးလုပ်နည်းသည် အထွက်တွင် ရောဂါရှာဖွေရေးကွက်များစွာကိုလည်း ထုတ်လုပ်ပေးပြီး Cook အကွာအဝေးကို ဤအထွက်တွင် တွေ့မြင်နိုင်သည်-

SAS တွင် အကွာအဝေးချက်ပြုတ်ပါ။

x-axis သည် စူးစမ်းမှုနံပါတ်ကိုပြသပြီး y-axis သည် ရှုမြင်မှုတစ်ခုစီအတွက် Cook အကွာအဝေးကိုပြသသည်။

အဖြတ်အတောက်ဖြတ်လိုင်းကို 4/n တွင်ထားရှိသည်ကို သတိပြုပါ (ဤကိစ္စတွင် n = 12၊ ထို့ကြောင့် ဖြတ်တောက်မှုသည် 0.33 ဖြစ်သည်) နှင့် dataset အတွင်းရှိ မှတ်သားစရာသုံးခုသည် ဤမျဉ်းထက်ကြီးသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ဤလေ့လာတွေ့ရှိချက်များသည် ဆုတ်ယုတ်မှုပုံစံအပေါ် ကြီးမားသောသြဇာလွှမ်းမိုးမှုရှိနိုင်သည်ကို ညွှန်ပြပြီး မော်ဒယ်ရလဒ်များကို ဘာသာပြန်ခြင်းမပြုမီ ပိုမိုနီးကပ်စွာ ဆန်းစစ်သင့်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် SAS တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

SAS တွင်ကျန်ရှိသောကြံစည်မှုတစ်ခုဖန်တီးနည်း
SAS တွင် Histograms ဖန်တီးနည်း
SAS တွင် point clouds ဖန်တီးနည်း
SAS တွင် outliers ကိုမည်သို့ခွဲခြားနိုင်မည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်