R တွင် ခိုင်မာသော ဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်နည်း (တစ်ဆင့်ပြီးတစ်ဆင့်)
Robust regression သည် ကျွန်ုပ်တို့နှင့် လုပ်ဆောင်နေသော ဒေတာအတွဲတွင် အစွန်းထွက်များ သို့မဟုတ် ဩဇာကြီးမားသော လေ့လာတွေ့ရှိမှုများ ရှိနေသောအခါတွင် သာမန် အနည်းဆုံး အနိမ့်ဆုံး လေးထောင့်ဆုတ်ယုတ်မှု၏ အစားထိုးတစ်ခုအဖြစ် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် နည်းလမ်းတစ်ခုဖြစ်သည်။
R တွင် ခိုင်မာသောဆုတ်ယုတ်မှုလုပ်ဆောင်ရန်၊ အောက်ပါ syntax ကိုအသုံးပြုသည့် MASS ပက်ကေ့ခ်ျမှ rlm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် ပေးထားသောဒေတာအတွဲအတွက် R တွင် ခိုင်မာသောဆုတ်ယုတ်မှုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသထားသည်။
အဆင့် 1: ဒေတာကိုဖန်တီးပါ။
ဦးစွာ၊ အတုအပ dataset တစ်ခုကို ဖန်တီးကြပါစို့-
#create data df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3, 11, 16, 16, 18, 19, 20, 23, 23, 24, 25), x2=c(7, 7, 4, 29, 13, 34, 17, 19, 20, 12, 25, 26, 26, 26, 27, 29, 30, 31, 31, 32), y=c(17, 170, 19, 194, 24, 2, 25, 29, 30, 32, 44, 60, 61, 63, 63, 64, 61, 67, 59, 70)) #view first six rows of data head(df) x1 x2 y 1 1 7 17 2 3 7 170 3 3 4 19 4 4 29 194 5 4 13 24 6 6 34 2
အဆင့် 2- သာမန် အနိမ့်ဆုံး လေးထောင့် ဆုတ်ယုတ်မှုကို လုပ်ဆောင်ပါ။
ထို့နောက်၊ သာမန် အနည်းဆုံး စတုရန်းပုံ ဆုတ်ယုတ်မှု ပုံစံကို ဖြည့်ပြီး စံသတ်မှတ်ထားသော အကြွင်းအကျန် များ၏ ကွက်ကွက်တစ်ခုကို ဖန်တီးကြပါစို့။
လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် ပကတိတန်ဖိုး 3 ထက်ကြီးသော စံသတ်မှတ်ထားသော ကျန်ရှိသောမည်သည့်အရာကိုမဆို အကြမ်းဖျင်းအဖြစ် သုံးသပ်လေ့ရှိသည်။
#fit ordinary least squares regression model ols <- lm(y~x1+x2, data=df) #create plot of y-values vs. standardized residuals plot(df$y, rstandard(ols), ylab=' Standardized Residuals ', xlab=' y ') abline(h= 0 )

ဂရပ်မှ 3 ပတ်၀န်းကျင်တွင် စံသတ်မှတ်ထားသော အကြွင်းအကျန်များဖြင့် ရှုမြင်ချက်နှစ်ခုရှိသည်ကို ကျွန်ုပ်တို့တွေ့နိုင်သည်။
၎င်းသည် ဒေတာအတွဲတွင် ဖြစ်နိုင်ချေရှိသော အကွာအဝေးနှစ်ခုရှိသည်ကို ညွှန်ပြသောကြောင့် ၎င်းအစား ခိုင်မာသောဆုတ်ယုတ်မှုမှ ကျွန်ုပ်တို့ အကျိုးရရှိနိုင်မည်ဖြစ်သည်။
အဆင့် 3- ခိုင်မာသော ဆုတ်ယုတ်မှုကို လုပ်ဆောင်ပါ။
ထို့နောက်၊ ခိုင်မာသောဆုတ်ယုတ်မှုပုံစံနှင့်ကိုက်ညီရန် rlm() လုပ်ဆောင်ချက်ကို အသုံးပြုကြပါစို့။
library (MASS)
#fit robust regression model
robust <- rlm(y~x1+x2, data=df)
ဤခိုင်မာသော ဆုတ်ယုတ်မှုပုံစံသည် OLS မော်ဒယ်နှင့် နှိုင်းယှဉ်ပါက ဒေတာနှင့် ပိုမိုကိုက်ညီမှုရှိမရှိ ဆုံးဖြတ်ရန်၊ မော်ဒယ်တစ်ခုစီ၏ ကျန်နေသော စံအမှားကို တွက်ချက်နိုင်ပါသည်။
ကျန်နေသောစံလွဲချော်မှု (RSE) သည် ဆုတ်ယုတ်မှုပုံစံရှိ အကြွင်းအကျန်များ၏ စံသွေဖည်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ CSR တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်တစ်ခုသည် အချက်အလက်နှင့် ကိုက်ညီလေလေ ဖြစ်သည်။
အောက်ပါကုဒ်သည် မော်ဒယ်တစ်ခုစီအတွက် RSE ကို တွက်ချက်နည်းကို ပြသသည်-
#find residual standard error of ols model summary(ols)$sigma [1] 49.41848 #find residual standard error of ols model summary(robust)$sigma [1] 9.369349
ခိုင်ခံ့သောဆုတ်ယုတ်မှုပုံစံ၏ RSE သည် သာမန်အနည်းဆုံးစတုရန်းအနိမ့်ဆုံးဆုတ်ယုတ်မှုပုံစံထက် များစွာနိမ့်သည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ၎င်းသည် ခိုင်မာသောဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့်ပို၍အံဝင်ခွင်ကျဖြစ်ကြောင်း ကျွန်ုပ်တို့ကိုပြောပြသည်။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် polynomial regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း