R ဖြင့် ချိန်ညှိထားသော r-squared တွက်ချက်နည်း
R-squared ၊ မကြာခဏရေးထားသော R2 သည် linear regression model တွင် ခန့်မှန်းသူကိန်းရှင်များမှ ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။
R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ 1 အထိရှိနိုင်ပါသည်။ 0 တန်ဖိုးတစ်ခုသည် ခန့်မှန်းသူကိန်းရှင်မှ ရှင်းပြခြင်းမပြုနိုင်သော်လည်း 1 တန်ဖိုးက တုံ့ပြန်မှုကိန်းရှင်ကို ခန့်မှန်းသူကိန်းရှင်က ရှင်းပြနိုင်သည်ဟု ညွှန်ပြနေပါသည်။ ခန့်မှန်းသူမှ အမှားအယွင်းမရှိ စုံလင်စွာ ရှင်းပြပါသည်။ ကိန်းရှင်များ။
Adjusted R-squared သည် regression model ရှိ ကြိုတင်ခန့်မှန်းသူအရေအတွက်အတွက် ချိန်ညှိပေးသော R-squared ၏ မွမ်းမံထားသောဗားရှင်းတစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။
ချိန်ညှိထားသော R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
ရွှေ-
- R 2 : မော်ဒယ်၏ R 2
- n : လေ့လာတွေ့ရှိချက်အရေအတွက်
- k : ကြိုတင်ခန့်မှန်းကိန်းရှင် အရေအတွက်
R2 သည် မော်ဒယ်တစ်ခုသို့ ကြိုတင်ခန့်မှန်းချက်များကို ပေါင်းထည့်လိုက်သည်နှင့်အမျှ အမြဲတမ်းတိုးလာသောကြောင့်၊ ချိန်ညှိထားသော R2 သည် မော်ဒယ်တစ်ခုအတွက် မည်မျှအသုံးဝင်သည်ကို ပြောပြသည့် မက်ထရစ်တစ်ခုအဖြစ် လုပ်ဆောင်နိုင်ပြီး မော်ဒယ်တစ်ခုအတွင်းရှိ ခန့်မှန်းသူအရေအတွက်အပေါ် မူတည်၍ ချိန်ညှိနိုင်သည် ။
ဤသင်ခန်းစာတွင် R တွင် ဆုတ်ယုတ်မှုပုံစံအတွက် ချိန်ညှိထားသော R2 ကို တွက်ချက်နည်းကို ရှင်းပြထားသည်။
ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။
ဥပမာ- R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း
mtcars ဟုခေါ်သော Built-in dataset ကို အသုံးပြု၍ R တွင် မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံတစ်ခုကို ဖန်တီးရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်ပါသည်။
model <- lm (hp ~ mpg + wt + drat + qsec, data=mtcars)
မော်ဒယ်၏ ချိန်ညှိထားသော R-squared ကိုရှာရန် နည်းလမ်းသုံးမျိုးထဲမှ တစ်ခုကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။
နည်းလမ်း 1- summary() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။
summary() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ မော်ဒယ်၏ R-squared နှင့် ချိန်ညှိထားသော R-squared နှစ်ခုလုံးကို မြင်ယောင်ကြည့်နိုင်သည်-
summary (model)
Call:
lm(formula = hp ~ mpg + wt + drat + qsec, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-48,801 -16,007 -5,482 11,614 97,338
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 473.779 105.213 4.503 0.000116 ***
mpg -2.877 2.381 -1.209 0.237319
wt 26.037 13.514 1.927 0.064600 .
drat 4.819 15.952 0.302 0.764910
qsec -20.751 3.993 -5.197 1.79e-05 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 32.25 on 27 degrees of freedom
Multiple R-squared: 0.8073, Adjusted R-squared: 0.7787
F-statistic: 28.27 on 4 and 27 DF, p-value: 2.647e-09
output ၏အောက်ခြေတွင်ကျွန်ုပ်တို့အောက်ပါကိုတွေ့နိုင်သည်:
- များစွာသော R နှစ်ထပ်ကိန်း- 0.8073
- ချိန်ညှိထားသော R-စတုရန်း- 0.7787
နည်းလမ်း 2- summary(model)$adj.r.squared ကိုသုံးပါ။
မော်ဒယ်၏ ချိန်ညှိထားသော R-squared ကို ရိုးရိုးရှင်းရှင်း ရယူလိုပါက၊ အောက်ပါ လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။
summary (model)$adj.r.squared
[1] 0.7787005
နည်းလမ်း 3- စိတ်ကြိုက်လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။
မော်ဒယ်၏ တပ်ဆင်ထားသော R-squared ကိုရှာဖွေရန် အခြားနည်းလမ်းမှာ စိတ်ကြိုက်လုပ်ဆောင်ချက်ကို ရေးရန်ဖြစ်သည်။
#define function to calculate adjusted R-squared
adj_r2 <- function (x) {
return (1 - ((1-summary(x)$r.squared)*( nobs (x)-1)/( nobs (x)- length (x$coefficients)-1)))
}
#use function to calculate adjusted R-squared of the model
adj_r2(model)
[1] 0.7787005
numeric(0)
ဤနေရာတွင် မျှဝေထားသော နည်းလမ်းသုံးခုမှ တစ်ခုစီသည် ချိန်ညှိထားသော R-squared အတွက် တူညီသောတန်ဖိုးကို ပေးသည်ကို သတိပြုပါ။
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် polynomial regression ကို မည်သို့လုပ်ဆောင်ရမည်နည်း