R တွင် regression output ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ
R တွင် linear regression model နှင့် ကိုက်ညီရန် lm() command ကိုသုံးနိုင်သည်။
regression model ၏ output ကိုပြသရန်၊ ထို့နောက် summary() command ကိုသုံးနိုင်သည်။
ဤသင်ခန်းစာတွင် R ရှိ ဆုတ်ယုတ်မှုအထွက်၏ တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ကို ဤသင်ခန်းစာတွင် ရှင်းပြထားသည်။
ဥပမာ- R တွင် Regression Output ကို ဘာသာပြန်ခြင်း
အောက်ပါကုဒ်သည် hp , drat နှင့် wt ကို ခန့်မှန်းသူကိန်းရှင်များအဖြစ် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် hp , drat နှင့် wt ကို အသုံးပြုထားသော ပေါင်းစပ် mtcars ဒေ တာ အတွဲနှင့် များစွာသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို မည်သို့အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြသည်-
#fit regression model using hp, drat, and wt as predictors model <- lm(mpg ~ hp + drat + wt, data = mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ hp + drat + wt, data = mtcars) Residuals: Min 1Q Median 3Q Max -3.3598 -1.8374 -0.5099 0.9681 5.7078 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 29.394934 6.156303 4.775 5.13e-05 *** hp -0.032230 0.008925 -3.611 0.001178 ** drat 1.615049 1.226983 1.316 0.198755 wt -3.227954 0.796398 -4.053 0.000364 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.561 on 28 degrees of freedom Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11
ဤသည်မှာ output တွင် တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ဖြစ်သည် ။
ဖုန်းဆက်ပါ။
Call: lm(formula = mpg ~ hp + drat + wt, data = mtcars)
ဤကဏ္ဍသည် ကျွန်ုပ်တို့၏ ဆုတ်ယုတ်မှုပုံစံတွင် အသုံးပြုခဲ့သည့် ဖော်မြူလာကို အမှတ်ရစေသည်။ ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် mpg နှင့် hp ၊ drat နှင့် wt ကို ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် အသုံးပြုထားသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ variable တစ်ခုစီသည် mtcars ဟုခေါ်သော dataset မှလာပါသည်။
အကြွင်းအကျန်
Residuals:
Min 1Q Median 3Q Max
-3.3598 -1.8374 -0.5099 0.9681 5.7078
ဤအပိုင်းသည် ဆုတ်ယုတ်မှုပုံစံမှ အကြွင်းအကျန်များ ဖြန့်ဖြူးခြင်း၏ အကျဉ်းချုပ်ကို ပြသည်။ ကျန်ရှိသောတစ်ခုသည် သတိပြုမိသောတန်ဖိုးနှင့် ဆုတ်ယုတ်မှုပုံစံ၏ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို သတိရပါ။
အနိမ့်ဆုံးကျန်ကြွင်းသည် -3.3598 ၊ ပျမ်းမျှအကြွင်းသည် -0.5099 နှင့် အများဆုံးကျန်ကြွင်းသည် 5.7078 ဖြစ်သည်။
ကိန်းဂဏန်းများ
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 29.394934 6.156303 4.775 5.13e-05 ***
hp -0.032230 0.008925 -3.611 0.001178 **
drat 1.615049 1.226983 1.316 0.198755
wt -3.227954 0.796398 -4.053 0.000364 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ဤကဏ္ဍသည် ဆုတ်ယုတ်မှုပုံစံ၏ ခန့်မှန်းကိန်းများကို ဖော်ပြသည်။ အောက်ဖော်ပြပါ ခန့်မှန်းခြေဆုတ်ယုတ်မှုညီမျှခြင်းကို ဖွဲ့စည်းရန် ဤကိန်းဂဏန်းများကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
mpg = 29.39 – 0.03*hp + 1.62*drat – 3.23* အလေးချိန်
ကြိုတင်ခန့်မှန်းကိန်းရှင်တစ်ခုစီအတွက်၊ ကျွန်ုပ်တို့သည် အောက်ပါတန်ဖိုးများကို လက်ခံရရှိသည်-
ခန့်မှန်းချက်- ခန့်မှန်းကိန်း။ ၎င်းသည် ခန့်မှန်းသူ variable တွင် တစ်ယူနစ်တိုးခြင်းနှင့် ဆက်စပ်နေသော တုံ့ပြန်မှုကိန်းရှင်၏ ပျမ်းမျှတိုးလာမှုကို ပြောပြသည်၊၊ အခြားကြိုတင်ခန့်မှန်းသူကိန်းရှင်အားလုံးသည် အမြဲမပြတ်ရှိနေသည်ဟု ယူဆပါသည်။
စံ။ အမှား – ဤသည်မှာ coefficient ၏ စံအမှားဖြစ်သည်။ ၎င်းသည် ကျွန်ုပ်တို့၏ ခန့်မှန်းကိန်း၏ မသေချာမရေရာမှု အတိုင်းအတာတစ်ခုဖြစ်သည်။
t-value- ဤသည်မှာ (Estimate) / (Standard Error) အဖြစ် တွက်ချက်ထားသော ခန့်မှန်းသူ variable အတွက် t-statistic ဖြစ်သည်။
Pr(>|t|): ၎င်းသည် t ကိန်းဂဏန်းနှင့် ကိုက်ညီသော p တန်ဖိုးဖြစ်သည်။ အကယ်၍ ဤတန်ဖိုးသည် အချို့သော အယ်လ်ဖာအဆင့် (ဥပမာ 0.05) အောက်တွင် ရှိနေပါက၊ ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်သည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ဆိုပါသည်။
အကယ်၍ ကျွန်ုပ်တို့သည် ဤဆုတ်ယုတ်မှုပုံစံတွင် မည်သည့်ကြိုတင်ခန့်မှန်းချက်များကို သိသာထင်ရှားစေသည်ကို ဆုံးဖြတ်ရန် α = 0.05 ၏ အယ်လ်ဖါအဆင့်ကို အသုံးပြုပါက၊ hp နှင့် wt တို့သည် drat မဟုတ်သော်လည်း ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ကြိုတင်ခန့်မှန်းသူများဖြစ်သည်ဟု ကျွန်ုပ်တို့ပြောနိုင်သည်။
မော်ဒယ်လုံလောက်မှု အကဲဖြတ်ခြင်း။
Residual standard error: 2.561 on 28 degrees of freedom Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11
ဆုတ်ယုတ်မှုပုံစံသည် ကျွန်ုပ်တို့၏ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန် ကူညီပေးသည့် ဤနောက်ဆုံးအပိုင်းတွင် နံပါတ်အမျိုးမျိုးကို ပြသထားသည်။
ကျန်နေသောစံနှုန်းအမှား- ၎င်းသည် သတိပြုမိသောတန်ဖိုးများနှင့် ဆုတ်ယုတ်မှုမျဉ်းကြားရှိ ပျမ်းမျှအကွာအဝေးကို ပြောပြသည်။ တန်ဖိုးသေးငယ်လေ၊ ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့် ကိုက်ညီလေလေဖြစ်သည်။
လွတ်လပ်မှုဒီဂရီများကို nk-1 အဖြစ် တွက်ချက်ပြီး n = စုစုပေါင်း ရှုမြင်ချက်အရေအတွက် နှင့် k = ခန့်မှန်းသူအရေအတွက်။ ဤဥပမာတွင်၊ mtcars တွင် ရှုမြင်မှု 32 ခုရှိပြီး regression model တွင် ကြိုတင်ခန့်မှန်းသူ 3 ခုကို အသုံးပြုထားသောကြောင့် လွတ်လပ်မှုဒီဂရီမှာ 32 – 3 – 1 = 28 ဖြစ်သည်။
Multiple R-squared- ဒါကို coefficient of determination လို့ခေါ်ပါတယ်။ တုံ့ပြန်မှုကိန်းရှင် တွင် ကွဲလွဲမှုမည်မျှရှိသည်ကို ခန့်မှန်းသူကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည်။
ဤတန်ဖိုးသည် 0 မှ 1 အထိ ကွာဟသည်။ ၎င်းသည် 1 နှင့် ပိုနီးစပ်လေ၊ ခန့်မှန်းသူကိန်းရှင်များသည် တုံ့ပြန်မှုကိန်းရှင်၏ တန်ဖိုးကို ခန့်မှန်းနိုင်လေဖြစ်သည်။
ချိန်ညှိထားသော R-squared- ၎င်းသည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းသူအရေအတွက်အပေါ် အခြေခံ၍ ချိန်ညှိထားသည့် R-squared ၏မွမ်းမံထားသောဗားရှင်းဖြစ်သည်။ ၎င်းသည် R နှစ်ထပ်ကိန်းထက် အမြဲနည်းသည်။
ချိန်ညှိထားသော R-squared သည် ကွဲပြားသော ကိန်းရှင်ကိန်းရှင်များကို အသုံးပြုသည့် မတူညီသော ဆုတ်ယုတ်မှုပုံစံများ၏ အံကိုက်ကို နှိုင်းယှဉ်ရန်အတွက် အသုံးဝင်ပါသည်။
F-statistic- ဆုတ်ယုတ်မှုပုံစံသည် သီးခြားကိန်းရှင်များမပါဝင်သည့် မော်ဒယ်ထက် ဒေတာနှင့် ပိုမိုကိုက်ညီမှုရှိမရှိ ညွှန်ပြသည်။ အခြေခံအားဖြင့်၊ ၎င်းသည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုလုံးအတွက် အသုံးဝင်မှုရှိမရှိ စမ်းသပ်သည်။
p-တန်ဖိုး- ဤသည်မှာ F ကိန်းဂဏန်းနှင့် ကိုက်ညီသော p-တန်ဖိုးဖြစ်သည်။ အကယ်၍ ဤတန်ဖိုးသည် အချို့သော အရေးပါမှုအဆင့် (ဥပမာ 0.05) အောက်တွင် ရှိနေပါက၊ ဆုတ်ယုတ်မှုပုံစံသည် ကြိုတင်ခန့်မှန်းခြင်းမရှိဘဲ မော်ဒယ်ထက် ဒေတာနှင့် ပိုမိုကောင်းမွန်ပါသည်။
ဆုတ်ယုတ်မှုပုံစံများကို တည်ဆောက်သည့်အခါ၊ ဤ p-value သည် တိကျသောအဆင့်တစ်ခုအောက်၌ ရှိနေမည်ဟု ကျွန်ုပ်တို့မျှော်လင့်ထားသောကြောင့်၊ ခန့်မှန်းသူကိန်းရှင်များသည် တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းရာတွင် အမှန်တကယ်အသုံးဝင်ကြောင်း ညွှန်ပြနေသောကြောင့်ဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။