R တွင် ကျန်နေသော စံအမှားကို တွက်ချက်နည်း
R တွင် linear regression model နှင့် ကိုက်ညီသည့်အခါတိုင်း၊ model သည် အောက်ပါပုံစံကို ယူသည်-
Y = β 0 + β 1 X + … + β i
ϵ သည် X နှင့် ကင်းသော အမှားအယွင်းတစ်ခုဖြစ်သည်။
Y ၏တန်ဖိုးများကိုခန့်မှန်းရန် X ကိုမည်မျှအသုံးပြုနိုင်ပါစေ၊ မော်ဒယ်တွင်ကျပန်းအမှားအမြဲရှိလိမ့်မည်။ ဤကျပန်းအမှား၏ပျံ့နှံ့မှုကိုတိုင်းတာရန်နည်းလမ်းတစ်ခုမှာ ကျန်ရှိသောစံလွဲချော်မှုကို ϵ တိုင်းတာခြင်းနည်းလမ်းဖြစ်သည့် ကျန်ရှိသောစံအမှားကို အသုံးပြုခြင်းဖြစ်သည်။
ဆုတ်ယုတ်မှုပုံစံတစ်ခု၏ ကျန်နေသော စံအမှားကို အောက်ပါအတိုင်း တွက်ချက်သည်-
ကျန်နေသောစံလွဲချော်မှု = √ SS အကြွင်းအကျန်များ / df အကြွင်းအကျန်များ
ရွှေ-
- ကျန်ရှိသော SS : ကျန်ရှိသော စတုရန်းများ ပေါင်းလဒ်။
- ကျန်ရှိသော df : ကျန်ရှိသော လွတ်လပ်ခွင့်ဒီဂရီ၊ n – k – 1 အဖြစ် တွက်ချက်သည့်နေရာတွင် n = စုစုပေါင်း ရှုမြင်မှု အရေအတွက် နှင့် k = စုစုပေါင်း မော်ဒယ် ကန့်သတ်ချက်များ အရေအတွက်။
R တွင် regression model တစ်ခု၏ကျန်နေသောစံလွဲချော်မှုကိုတွက်ချက်ရန်ကျွန်ုပ်တို့သုံးနိုင်သည့်နည်းလမ်းသုံးမျိုးရှိပါသည်။
နည်းလမ်း 1- မော်ဒယ်အနှစ်ချုပ်ကို ပိုင်းခြားစိတ်ဖြာပါ။
ကျန်နေသောစံနှုန်းအမှားကိုရယူရန် ပထမနည်းလမ်းမှာ linear regression model ကို ရိုးရှင်းစွာ ဖြည့်သွင်းပြီးနောက် မော်ဒယ်ရလဒ်များရရှိရန် summary() command ကို အသုံးပြုပါ။ ထို့နောက် output ၏အောက်ခြေရှိ “ ကျန်နေသောစံအမှား” ကိုရှာပါ။
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
ကျန်ရှိသောစံအမှားသည် 3.127 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
နည်းလမ်း 2- ရိုးရှင်းသောဖော်မြူလာကို အသုံးပြုပါ။
ကျန်ရှိသောစံလွဲချော်မှု (RSE) ကိုရရှိရန်နောက်ထပ်နည်းလမ်းမှာ linear regression model တစ်ခုနှင့်ကိုက်ညီပြီး RSE ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကိုအသုံးပြုပါ။
sqrt( deviance (model)/df. residual (model))
ဤဖော်မြူလာကို R တွင် အကောင်အထည်ဖော်နည်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
ကျန်ရှိသောစံအမှားသည် 3.126601 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
နည်းလမ်း 3- အဆင့်ဆင့်ဖော်မြူလာကို အသုံးပြုပါ။
ကျန်ရှိနေသော စံအမှားကို ရယူရန် နောက်ထပ်နည်းလမ်းမှာ မျဉ်းကြောင်းအတိုင်း ဆုတ်ယုတ်မှုပုံစံကို အံဝင်ခွင်ကျဖြစ်စေရန်ဖြစ်ပြီး RSE ဖော်မြူလာ၏ အစိတ်အပိုင်းတစ်ခုစီကို တွက်ချက်ရန် အဆင့်ဆင့်ချဉ်းကပ်နည်းကို အသုံးပြုပါ။
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
ကျန်ရှိသောစံအမှားသည် 3.126601 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
ကျန်နေသောစံအမှားကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ
အစောပိုင်းတွင် ဖော်ပြခဲ့သည့်အတိုင်း ကျန်ရှိသောစံလွဲချော်မှု (RSE) သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုရှိ အကြွင်းအကျန်များ၏ စံသွေဖည်မှုကို တိုင်းတာသည့်နည်းလမ်းတစ်ခုဖြစ်သည်။
CSR တန်ဖိုးနိမ့်လေ၊ မော်ဒယ်တစ်ခုသည် ဒေတာနှင့် အံဝင်ခွင်ကျဖြစ်လေလေ (သို့သော် အံဝင်ခွင်ကျ မဖြစ်စေရန် သတိပြုပါ)။ မော်ဒယ်နှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော မော်ဒယ်များကို နှိုင်းယှဉ်ရာတွင် မည်သည့်မော်ဒယ်သည် ဒေတာနှင့် အကိုက်ညီဆုံးဖြစ်ကြောင်း ဆုံးဖြတ်ရန် ၎င်းသည် အသုံးဝင်သော မက်ထရစ်တစ်ခု ဖြစ်နိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
ကျန်နေသောစံအမှားကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် မော်ဒယ်စွမ်းဆောင်ရည်အတွက် အပြန်အလှန်အတည်ပြုနည်း
R တွင် စံသွေဖည်တွက်ချက်နည်း