R တွင် ဆုံးဖြတ်ခြင်း၏ ကိန်းဂဏန်း (r-squared) ကို မည်သို့ရှာရမည်နည်း။


ဆုံးဖြတ်ခြင်း၏ကိန်းဂဏန်း (အများအားဖြင့် R 2 ကို ရည်ညွှန်းသည်) သည် ဆုတ်ယုတ်မှုပုံစံတွင် ရှင်းပြထားသော ကိန်းရှင်များဖြင့် ရှင်းပြနိုင်သည့် တုံ့ပြန်မှုကိန်းရှင် ၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။

ဤသင်ခန်းစာသည် R တွင် ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် R2 ကို ရှာဖွေပြီး အဓိပ္ပာယ်ပြန်ဆိုနည်းကို ဥပမာပေးထားသည်။

ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။

ဥပမာ- R တွင် R-square ကို ရှာဖွေခြင်းနှင့် ဘာသာပြန်ခြင်း

ကျွန်ုပ်တို့တွင် လေ့လာခဲ့သည့် နာရီအရေအတွက်၊ ကြိုတင်ပြင်ဆင်မှုစာမေးပွဲများနှင့် ကျောင်းသား 15 ဦးအတွက် ရရှိသော စာမေးပွဲရမှတ်များဆိုင်ရာ ဒေတာပါ၀င်သော အောက်ပါဒေတာအတွဲကို ဆိုပါစို့။

 #create data frame
df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#view first six rows of data frame
head(df)

  hours prep_exams score
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

အောက်ဖော်ပြပါ ကုဒ်သည် ဤဒေတာအတွဲအတွက် များစွာသောမျဉ်းကြောင်း ဆုတ်ယုတ်မှုပုံစံကို မည်သို့အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြပြီး မော်ဒယ်အထွက်ကို R တွင်ပြသသည်-

 #fit regression model
model <- lm(score~hours+prep_exams, data=df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours + prep_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-7.9896 -2.5514 0.3079 3.3370 7.0352 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 71.8078 3.5222 20.387 1.12e-10 ***
hours 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.944 on 12 degrees of freedom
Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 
F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454

မော်ဒယ်၏ R-squared (အထွက်၏အောက်ခြေတွင်ပြထားသည်) သည် 0.7237 ဖြစ်သွားသည်။

ဆိုလိုသည်မှာ စာမေးပွဲရမှတ်များ ကွဲလွဲမှု၏ 72.37% ကို လေ့လာသည့် နာရီအရေအတွက်နှင့် ဖြေဆိုခဲ့သော လေ့ကျင့်မှု စာမေးပွဲအရေအတွက်ဖြင့် ရှင်းပြနိုင်သည်။

အောက်ပါ syntax ကို အသုံးပြု၍ ဤတန်ဖိုးကိုလည်း သင်ဝင်ရောက်နိုင်သည်ကို သတိပြုပါ။

 summary(model)$r.squared

[1] 0.7236545

R-squared တန်ဖိုးကို ဘယ်လိုအဓိပ္ပာယ်ဖွင့်မလဲ။

R နှစ်ထပ်ကိန်းတန်ဖိုးသည် 0 နှင့် 1 ကြားတွင် အမြဲရှိနေမည်ဖြစ်သည်။

1 ၏တန်ဖိုးသည် တုံ့ပြန်မှုကိန်းရှင်၏ကွဲလွဲမှုကို စုံလင်စွာရှင်းပြနိုင်ပြီး 0 တန်ဖိုးသည် တုံ့ပြန်မှုကိန်းရှင်၏ကွဲလွဲမှုကို ရှင်းပြနိုင်စွမ်းမရှိဟု 1 ၏တန်ဖိုးကဖော်ပြသည်။

ယေဘုယျအားဖြင့်၊ regression model တစ်ခု၏ R-squared တန်ဖိုး ပိုကြီးလေ၊ explanatory variables များသည် response variable ၏တန်ဖိုးကို ခန့်မှန်းနိုင်လေလေဖြစ်သည်။

ပေးထားသော ဆုတ်ယုတ်မှုပုံစံအတွက် ပေးထားသော R-squared တန်ဖိုးကို “ ကောင်း” ဟု သတ်မှတ်ခြင်း ရှိ၊ မရှိ ဆုံးဖြတ်နည်းကို အသေးစိတ်သိရှိနိုင်ရန် ဤဆောင်းပါးကို ကြည့်ပါ။

ဆက်စပ်- R ဖြင့် ချိန်ညှိထားသော R-squared တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်