R တွင် စံသတ်မှတ်ထားသော အကြွင်းအကျန်များကို တွက်ချက်နည်း


ကျန်ရှိသော ဆိုသည်မှာ မှတ်သားထားသောတန်ဖိုးနှင့် ဆုတ်ယုတ်မှုပုံစံ တစ်ခုရှိ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

လက်ကျန် = သတိပြုမိသော တန်ဖိုး – ခန့်မှန်းထားသော တန်ဖိုး

ကျွန်ုပ်တို့ သတိပြုမိသော တန်ဖိုးများကို ပုံဖော်ကာ တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုမျဉ်းကို ခြုံငုံမိပါက၊ ရှုမြင်မှု တစ်ခုစီအတွက် အကြွင်းအကျန်များသည် စူးစမ်းလေ့လာခြင်းနှင့် ဆုတ်ယုတ်မှုမျဉ်းကြား ဒေါင်လိုက်အကွာအဝေးဖြစ်လိမ့်မည်-

ကိန်းဂဏန်းစာရင်းဇယားတွင် ကျန်ရှိနေသော ဥပမာ

ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ အစွန်းများကို ခွဲခြားသတ်မှတ်ရန် ကျွန်ုပ်တို့အသုံးပြုလေ့ရှိသော အကြွင်းအကျန်အမျိုးအစားတစ်ခုကို စံပြုကျန်နေသေး သည်ဟု ခေါ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

r i = e i / s(e i ) = e i / RSE√ 1-h ii

ရွှေ-

  • e i : i th အကြွင်း
  • RSE- မော်ဒယ်၏ ကျန်နေသော စံလွဲချော်မှု
  • h II : IT စောင့်ကြည့်မှု မြင့်တက်လာခြင်း။

လက်တွေ့တွင်၊ ကျွန်ုပ်တို့သည် ပကတိတန်ဖိုး 3 ထက်ကြီးသော စံသတ်မှတ်ထားသော ကျန်ရှိသောမည်သည့်အရာကိုမဆို အကြမ်းဖျင်းအဖြစ် သုံးသပ်လေ့ရှိသည်။

ဤကျူတိုရီရယ်တွင် R တွင် စံချိန်စံညွှန်းပြုထားသော အကြွင်းအကျန်များကို တွက်ချက်နည်း အဆင့်ဆင့် ဥပမာကို ပေးသည်။

အဆင့် 1: ဒေတာကိုထည့်ပါ။

ပထမဦးစွာ R တွင်အလုပ်လုပ်ရန် သေးငယ်သောဒေတာအတွဲတစ်ခုကို ဖန်တီးပါမည်။

 #create data
data <- data.frame(x=c(8, 12, 12, 13, 14, 16, 17, 22, 24, 26, 29, 30),
                   y=c(41, 42, 39, 37, 35, 39, 45, 46, 39, 49, 55, 57))

#viewdata
data

    xy
1 8 41
2 12 42
3 12 39
4 13 37
5 14 35
6 16 39
7 17 45
8 22 46
9 24 39
10 26 49
11 29 55
12 30 57

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

ထို့နောက်၊ ရိုးရှင်းသော linear regression model နှင့်ကိုက်ညီရန် lm() function ကိုအသုံးပြုပါမည်။

 #fit model
model <- lm(y ~ x, data=data)

#view model summary
summary(model) 

Call:
lm(formula = y ~ x, data = data)

Residuals:
    Min 1Q Median 3Q Max 
-8.7578 -2.5161 0.0292 3.3457 5.3268 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.6309 3.6189 8.188 9.6e-06 ***
x 0.7553 0.1821 4.148 0.00199 ** 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.442 on 10 degrees of freedom
Multiple R-squared: 0.6324, Adjusted R-squared: 0.5956 
F-statistic: 17.2 on 1 and 10 DF, p-value: 0.001988

အဆင့် 3- စံသတ်မှတ်ထားသော အကြွင်းအကျန်များကို တွက်ချက်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်၏ စံသတ်မှတ်ထားသော ကျန်ရှိနေမှုများကို တွက်ချက်ရန် built-in လုပ်ဆောင်ချက် rstandard() ကို အသုံးပြုပါမည်။

 #calculate the standardized residuals
standard_res <- rstandard(model)

#view the standardized residuals
standard_res

          1 2 3 4 5 6 
 1.40517322 0.81017562 0.07491009 -0.59323342 -1.24820530 -0.64248883 
          7 8 9 10 11 12 
 0.59610905 -0.05876884 -2.11711982 -0.06655600 0.91057211 1.26973888

ကျွန်ုပ်တို့ဆန္ဒရှိပါက မူရင်းဒေတာဘောင်သို့ စံသတ်မှတ်ထားသော ကျန်ရှိသောပစ္စည်းများကို ထည့်နိုင်သည်-

 #column bind standardized residuals back to original data frame
final_data <- cbind(data, standard_res)

#view data frame
    xy standard_res
1 8 41 1.40517322
2 12 42 0.81017562
3 12 39 0.07491009
4 13 37 -0.59323342
5 14 35 -1.24820530
6 16 39 -0.64248883
7 17 45 0.59610905
8 22 46 -0.05876884
9 24 39 -2.11711982
10 26 49 -0.06655600
11 29 55 0.91057211
12 30 57 1.26973888

ထို့နောက် စောင့်ကြည့်မှုတစ်ခုစီကို အကြီးမှအသေးဆုံးအထိ စီခွဲနိုင်သည်-

 #sort standardized residuals descending
final_data[ order (-standard_res),]

    xy standard_res
1 8 41 1.40517322
12 30 57 1.26973888
11 29 55 0.91057211
2 12 42 0.81017562
7 17 45 0.59610905
3 12 39 0.07491009
8 22 46 -0.05876884
10 26 49 -0.06655600
4 13 37 -0.59323342
6 16 39 -0.64248883
5 14 35 -1.24820530
9 24 39 -2.11711982

ရလဒ်များမှ၊ စံသတ်မှတ်ထားသော အကြွင်းအကျန်တစ်ခုမှ 3 ၏ ပကတိတန်ဖိုးထက် မကျော်လွန်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ ထို့ကြောင့် လေ့လာတွေ့ရှိချက်တစ်ခုမှ အစွန်းထွက်ပုံမပေါ်ပါ။

အဆင့် 4- စံသတ်မှတ်ထားသော အကြွင်းအကျန်များကို မြင်ယောင်ကြည့်ပါ။

နောက်ဆုံးတွင်၊ စံသတ်မှတ်ထားသော အကြွင်းအကျန်များနှင့် ဆန့်ကျင်ဘက်ဖြစ်သော ခန့်မှန်းသူကိန်းရှင်၏ တန်ဖိုးများကို မြင်သာစေရန် အပိုင်းအစတစ်ခုကို ဖန်တီးနိုင်သည်-

 #plot predictor variable vs. standardized residuals
plot(final_data$x, standard_res, ylab=' Standardized Residuals ', xlab=' x ') 

#add horizontal line at 0
abline(0, 0)

ထပ်လောင်းအရင်းအမြစ်များ

အကြွင်းအကျန်တွေက ဘာတွေလဲ။
စံသတ်မှတ်ထားသော အကြွင်းအကျန်များသည် အဘယ်နည်း။
Multiple Linear Regression အကြောင်း နိဒါန်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်