R တွင် regression output ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

R တွင် linear regression model နှင့် ကိုက်ညီရန် lm() command ကိုသုံးနိုင်သည်။

regression model ၏ output ကိုပြသရန်၊ ထို့နောက် summary() command ကိုသုံးနိုင်သည်။

ဤသင်ခန်းစာတွင် R ရှိ ဆုတ်ယုတ်မှုအထွက်၏ တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ကို ဤသင်ခန်းစာတွင် ရှင်းပြထားသည်။

ဥပမာ- R တွင် Regression Output ကို ဘာသာပြန်ခြင်း

အောက်ပါကုဒ်သည် hp , drat နှင့် wt ကို ခန့်မှန်းသူကိန်းရှင်များအဖြစ် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် hp , drat နှင့် wt ကို အသုံးပြုထားသော ပေါင်းစပ် mtcars ဒေ တာ အတွဲနှင့် များစွာသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို မည်သို့အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြသည်-

 #fit regression model using hp, drat, and wt as predictors
model <- lm(mpg ~ hp + drat + wt, data = mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-3.3598 -1.8374 -0.5099 0.9681 5.7078 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.394934 6.156303 4.775 5.13e-05 ***
hp -0.032230 0.008925 -3.611 0.001178 ** 
drat 1.615049 1.226983 1.316 0.198755    
wt -3.227954 0.796398 -4.053 0.000364 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 
F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11

ဤသည်မှာ output တွင် တန်ဖိုးတစ်ခုစီကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုရမည်ဖြစ်သည် ။

ဖုန်းဆက်ပါ။

 Call:
lm(formula = mpg ~ hp + drat + wt, data = mtcars)

ဤကဏ္ဍသည် ကျွန်ုပ်တို့၏ ဆုတ်ယုတ်မှုပုံစံတွင် အသုံးပြုခဲ့သည့် ဖော်မြူလာကို အမှတ်ရစေသည်။ ကျွန်ုပ်တို့သည် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် mpg နှင့် hp ၊ drat နှင့် wt ကို ကြိုတင်ခန့်မှန်းကိန်းရှင်များအဖြစ် အသုံးပြုထားသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ variable တစ်ခုစီသည် mtcars ဟုခေါ်သော dataset မှလာပါသည်။

အကြွင်းအကျန်

 Residuals:
    Min 1Q Median 3Q Max 
-3.3598 -1.8374 -0.5099 0.9681 5.7078

ဤအပိုင်းသည် ဆုတ်ယုတ်မှုပုံစံမှ အကြွင်းအကျန်များ ဖြန့်ဖြူးခြင်း၏ အကျဉ်းချုပ်ကို ပြသည်။ ကျန်ရှိသောတစ်ခုသည် သတိပြုမိသောတန်ဖိုးနှင့် ဆုတ်ယုတ်မှုပုံစံ၏ ခန့်မှန်းတန်ဖိုးကြား ကွာခြားချက်ကို သတိရပါ။

အနိမ့်ဆုံးကျန်ကြွင်းသည် -3.3598 ၊ ပျမ်းမျှအကြွင်းသည် -0.5099 နှင့် အများဆုံးကျန်ကြွင်းသည် 5.7078 ဖြစ်သည်။

ကိန်းဂဏန်းများ

 Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 29.394934 6.156303 4.775 5.13e-05 ***
hp -0.032230 0.008925 -3.611 0.001178 ** 
drat 1.615049 1.226983 1.316 0.198755    
wt -3.227954 0.796398 -4.053 0.000364 ***

---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ဤကဏ္ဍသည် ဆုတ်ယုတ်မှုပုံစံ၏ ခန့်မှန်းကိန်းများကို ဖော်ပြသည်။ အောက်ဖော်ပြပါ ခန့်မှန်းခြေဆုတ်ယုတ်မှုညီမျှခြင်းကို ဖွဲ့စည်းရန် ဤကိန်းဂဏန်းများကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

mpg = 29.39 – 0.03*hp + 1.62*drat – 3.23* အလေးချိန်

ကြိုတင်ခန့်မှန်းကိန်းရှင်တစ်ခုစီအတွက်၊ ကျွန်ုပ်တို့သည် အောက်ပါတန်ဖိုးများကို လက်ခံရရှိသည်-

ခန့်မှန်းချက်- ခန့်မှန်းကိန်း။ ၎င်းသည် ခန့်မှန်းသူ variable တွင် တစ်ယူနစ်တိုးခြင်းနှင့် ဆက်စပ်နေသော တုံ့ပြန်မှုကိန်းရှင်၏ ပျမ်းမျှတိုးလာမှုကို ပြောပြသည်၊၊ အခြားကြိုတင်ခန့်မှန်းသူကိန်းရှင်အားလုံးသည် အမြဲမပြတ်ရှိနေသည်ဟု ယူဆပါသည်။

စံ။ အမှား – ဤသည်မှာ coefficient ၏ စံအမှားဖြစ်သည်။ ၎င်းသည် ကျွန်ုပ်တို့၏ ခန့်မှန်းကိန်း၏ မသေချာမရေရာမှု အတိုင်းအတာတစ်ခုဖြစ်သည်။

t-value- ဤသည်မှာ (Estimate) / (Standard Error) အဖြစ် တွက်ချက်ထားသော ခန့်မှန်းသူ variable အတွက် t-statistic ဖြစ်သည်။

Pr(>|t|): ၎င်းသည် t ကိန်းဂဏန်းနှင့် ကိုက်ညီသော p တန်ဖိုးဖြစ်သည်။ အကယ်၍ ဤတန်ဖိုးသည် အချို့သော အယ်လ်ဖာအဆင့် (ဥပမာ 0.05) အောက်တွင် ရှိနေပါက၊ ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်သည် ကိန်းဂဏန်းအရ သိသာထင်ရှားသည်ဟု ဆိုပါသည်။

အကယ်၍ ကျွန်ုပ်တို့သည် ဤဆုတ်ယုတ်မှုပုံစံတွင် မည်သည့်ကြိုတင်ခန့်မှန်းချက်များကို သိသာထင်ရှားစေသည်ကို ဆုံးဖြတ်ရန် α = 0.05 ၏ အယ်လ်ဖါအဆင့်ကို အသုံးပြုပါက၊ hp နှင့် wt တို့သည် drat မဟုတ်သော်လည်း ကိန်းဂဏန်းအရ သိသာထင်ရှားသော ကြိုတင်ခန့်မှန်းသူများဖြစ်သည်ဟု ကျွန်ုပ်တို့ပြောနိုင်သည်။

မော်ဒယ်လုံလောက်မှု အကဲဖြတ်ခြင်း။

 Residual standard error: 2.561 on 28 degrees of freedom
Multiple R-squared: 0.8369, Adjusted R-squared: 0.8194 
F-statistic: 47.88 on 3 and 28 DF, p-value: 3.768e-11

ဆုတ်ယုတ်မှုပုံစံသည် ကျွန်ုပ်တို့၏ဒေတာအစုံနှင့် မည်မျှကိုက်ညီကြောင်း အကဲဖြတ်ရန် ကူညီပေးသည့် ဤနောက်ဆုံးအပိုင်းတွင် နံပါတ်အမျိုးမျိုးကို ပြသထားသည်။

ကျန်နေသောစံနှုန်းအမှား- ၎င်းသည် သတိပြုမိသောတန်ဖိုးများနှင့် ဆုတ်ယုတ်မှုမျဉ်းကြားရှိ ပျမ်းမျှအကွာအဝေးကို ပြောပြသည်။ တန်ဖိုးသေးငယ်လေ၊ ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့် ကိုက်ညီလေလေဖြစ်သည်။

လွတ်လပ်မှုဒီဂရီများကို nk-1 အဖြစ် တွက်ချက်ပြီး n = စုစုပေါင်း ရှုမြင်ချက်အရေအတွက် နှင့် k = ခန့်မှန်းသူအရေအတွက်။ ဤဥပမာတွင်၊ mtcars တွင် ရှုမြင်မှု 32 ခုရှိပြီး regression model တွင် ကြိုတင်ခန့်မှန်းသူ 3 ခုကို အသုံးပြုထားသောကြောင့် လွတ်လပ်မှုဒီဂရီမှာ 32 – 3 – 1 = 28 ဖြစ်သည်။

Multiple R-squared- ဒါကို coefficient of determination လို့ခေါ်ပါတယ်။ တုံ့ပြန်မှုကိန်းရှင် တွင် ကွဲလွဲမှုမည်မျှရှိသည်ကို ခန့်မှန်းသူကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည်။

ဤတန်ဖိုးသည် 0 မှ 1 အထိ ကွာဟသည်။ ၎င်းသည် 1 နှင့် ပိုနီးစပ်လေ၊ ခန့်မှန်းသူကိန်းရှင်များသည် တုံ့ပြန်မှုကိန်းရှင်၏ တန်ဖိုးကို ခန့်မှန်းနိုင်လေဖြစ်သည်။

ချိန်ညှိထားသော R-squared- ၎င်းသည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းသူအရေအတွက်အပေါ် အခြေခံ၍ ချိန်ညှိထားသည့် R-squared ၏မွမ်းမံထားသောဗားရှင်းဖြစ်သည်။ ၎င်းသည် R နှစ်ထပ်ကိန်းထက် အမြဲနည်းသည်။

ချိန်ညှိထားသော R-squared သည် ကွဲပြားသော ကိန်းရှင်ကိန်းရှင်များကို အသုံးပြုသည့် မတူညီသော ဆုတ်ယုတ်မှုပုံစံများ၏ အံကိုက်ကို နှိုင်းယှဉ်ရန်အတွက် အသုံးဝင်ပါသည်။

F-statistic- ဆုတ်ယုတ်မှုပုံစံသည် သီးခြားကိန်းရှင်များမပါဝင်သည့် မော်ဒယ်ထက် ဒေတာနှင့် ပိုမိုကိုက်ညီမှုရှိမရှိ ညွှန်ပြသည်။ အခြေခံအားဖြင့်၊ ၎င်းသည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုလုံးအတွက် အသုံးဝင်မှုရှိမရှိ စမ်းသပ်သည်။

p-တန်ဖိုး- ဤသည်မှာ F ကိန်းဂဏန်းနှင့် ကိုက်ညီသော p-တန်ဖိုးဖြစ်သည်။ အကယ်၍ ဤတန်ဖိုးသည် အချို့သော အရေးပါမှုအဆင့် (ဥပမာ 0.05) အောက်တွင် ရှိနေပါက၊ ဆုတ်ယုတ်မှုပုံစံသည် ကြိုတင်ခန့်မှန်းခြင်းမရှိဘဲ မော်ဒယ်ထက် ဒေတာနှင့် ပိုမိုကောင်းမွန်ပါသည်။

ဆုတ်ယုတ်မှုပုံစံများကို တည်ဆောက်သည့်အခါ၊ ဤ p-value သည် တိကျသောအဆင့်တစ်ခုအောက်၌ ရှိနေမည်ဟု ကျွန်ုပ်တို့မျှော်လင့်ထားသောကြောင့်၊ ခန့်မှန်းသူကိန်းရှင်များသည် တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းရာတွင် အမှန်တကယ်အသုံးဝင်ကြောင်း ညွှန်ပြနေသောကြောင့်ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။