R တွင် ခိုင်မာသော ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်နည်း (တစ်ဆင့်ပြီးတစ်ဆင့်)


Robust regression သည် ကျွန်ုပ်တို့နှင့် လုပ်ဆောင်နေသော ဒေတာအတွဲတွင် အစွန်းထွက်များ သို့မဟုတ် ဩဇာကြီးမားသော လေ့လာတွေ့ရှိမှုများ ရှိနေသောအခါတွင် သာမန် အနည်းဆုံး အနိမ့်ဆုံး လေးထောင့်ဆုတ်ယုတ်မှု၏ အစားထိုးတစ်ခုအဖြစ် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။

R တွင် ခိုင်မာသောဆုတ်ယုတ်မှုလုပ်ဆောင်ရန်၊ အောက်ပါ syntax ကိုအသုံးပြုသည့် MASS ပက်ကေ့ခ်ျမှ rlm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် ပေးထားသောဒေတာအတွဲအတွက် R တွင် ခိုင်မာသောဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ဦးစွာ၊ အတုအပ dataset တစ်ခုကို ဖန်တီးကြပါစို့-

 #create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3,
                      11, 16, 16, 18, 19, 20, 23, 23, 24, 25),
                 x2=c(7, 7, 4, 29, 13, 34, 17, 19, 20, 12,
                      25, 26, 26, 26, 27, 29, 30, 31, 31, 32),
                  y=c(17, 170, 19, 194, 24, 2, 25, 29, 30, 32,
                      44, 60, 61, 63, 63, 64, 61, 67, 59, 70))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 170
3 3 4 19
4 4 29 194
5 4 13 24
6 6 34 2

အဆင့် 2- သာမန် အနိမ့်ဆုံး လေးထောင့် ဆုတ်ယုတ်မှုကို လုပ်ဆောင်ပါ။

ထို့နောက်၊ သာမန် အနည်းဆုံး စတုရန်းပုံ ဆုတ်ယုတ်မှု ပုံစံကို ဖြည့်ပြီး စံသတ်မှတ်ထားသော အကြွင်းအကျန် များ၏ ကွက်ကွက်တစ်ခုကို ဖန်တီးကြပါစို့။

လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် ပကတိတန်ဖိုး 3 ထက်ကြီးသော စံသတ်မှတ်ထားသော ကျန်ရှိသောမည်သည့်အရာကိုမဆို အကြမ်းဖျင်းအဖြစ် သုံးသပ်လေ့ရှိသည်။

 #fit ordinary least squares regression model
ols <- lm(y~x1+x2, data=df)

#create plot of y-values vs. standardized residuals
plot(df$y, rstandard(ols), ylab=' Standardized Residuals ', xlab=' y ') 
abline(h= 0 ) 

ဂရပ်မှ 3 ပတ်၀န်းကျင်တွင် စံသတ်မှတ်ထားသော အကြွင်းအကျန်များဖြင့် ရှုမြင်ချက်နှစ်ခုရှိသည်ကို ကျွန်ုပ်တို့တွေ့နိုင်သည်။

၎င်းသည် ဒေတာအတွဲတွင် ဖြစ်နိုင်ချေရှိသော အကွာအဝေးနှစ်ခုရှိသည်ကို ညွှန်ပြသောကြောင့် ၎င်းအစား ခိုင်မာသောဆုတ်ယုတ်မှုမှ ကျွန်ုပ်တို့ အကျိုးရရှိနိုင်မည်ဖြစ်သည်။

အဆင့် 3- ခိုင်မာသော ဆုတ်ယုတ်မှုကို လုပ်ဆောင်ပါ။

ထို့နောက်၊ ခိုင်မာသောဆုတ်ယုတ်မှုပုံစံနှင့်ကိုက်ညီရန် rlm() လုပ်ဆောင်ချက်ကို အသုံးပြုကြပါစို့။

 library (MASS)

#fit robust regression model
robust <- rlm(y~x1+x2, data=df)

ဤခိုင်မာသော ဆုတ်ယုတ်မှုပုံစံသည် OLS မော်ဒယ်နှင့် နှိုင်းယှဉ်ပါက ဒေတာနှင့် ပိုမိုကိုက်ညီမှုရှိမရှိ ဆုံးဖြတ်ရန်၊ မော်ဒယ်တစ်ခုစီ၏ ကျန်နေသော စံအမှားကို တွက်ချက်နိုင်ပါသည်။

ကျန်နေသောစံလွဲချော်မှု (RSE) သည် ဆုတ်ယုတ်မှုပုံစံရှိ အကြွင်းအကျန်များ၏ စံသွေဖည်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ CSR တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်တစ်ခုသည် အချက်အလက်နှင့် ကိုက်ညီလေလေ ဖြစ်သည်။

အောက်ပါကုဒ်သည် မော်ဒယ်တစ်ခုစီအတွက် RSE ကို တွက်ချက်နည်းကို ပြသသည်-

 #find residual standard error of ols model
summary(ols)$sigma

[1] 49.41848

#find residual standard error of ols model
summary(robust)$sigma

[1] 9.369349

ခိုင်ခံ့သောဆုတ်ယုတ်မှုပုံစံ၏ RSE သည် သာမန်အနည်းဆုံးစတုရန်းအနိမ့်ဆုံးဆုတ်ယုတ်မှုပုံစံထက် များစွာနိမ့်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ၎င်းသည် ခိုင်မာသောဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့်ပို၍အံဝင်ခွင်ကျဖြစ်ကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် polynomial regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်