R တွင် ခန့်မှန်းကြားကာလတစ်ခုကို ဖန်တီးနည်း
linear regression model သည် အရာနှစ်ခုအတွက် အသုံးဝင်နိုင်သည်-
(၁) ကြိုတင်ခန့်မှန်းကိန်းရှင် တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုကို အရေအတွက်သတ်မှတ်ပါ။
(၂) အနာဂတ်တန်ဖိုးများကို ခန့်မှန်းရန် မော်ဒယ်ကို အသုံးပြုပါ။
(၂) နှင့်ပတ်သက်၍၊ အနာဂတ်တန်ဖိုးများကို ခန့်မှန်းရန် ဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုသောအခါ၊ အတိအကျတန်ဖိုး နှစ်ခုလုံးနှင့် ဖြစ်နိုင်ခြေရှိသောတန်ဖိုးများပါရှိသော ကြားကာလကို မကြာခဏ ခန့်မှန်းလိုပါသည်။ ဤကြားကာလကို ခန့်မှန်းကာလ ဟု ခေါ်သည်။
ဥပမာအားဖြင့်၊ ခန့်မှန်းသူကိန်းရှင်နှင့် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် စာမေးပွဲရမှတ်များအဖြစ် လေ့လာထားသော နာရီများကို အသုံးပြု၍ ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့ အံဝင်ခွင်ကျဖြစ်စေသည်ဆိုပါစို့။ ဤပုံစံကိုအသုံးပြု၍ 6 နာရီကြာလေ့လာသောကျောင်းသားသည် စာမေးပွဲတွင် 91 မှတ်ရလိမ့်မည်ဟုကျွန်ုပ်တို့ခန့်မှန်းနိုင်ပါသည်။
သို့သော်၊ ဤခန့်မှန်းချက်နှင့်ပတ်သက်၍ မသေချာမရေရာမှုများကြောင့်၊ 6 နာရီကြာလေ့လာသောကျောင်းသားတစ်ဦးသည် စာမေးပွဲရမှတ် 85 နှင့် 97 အကြားရရှိရန် 95% အခွင့်အလမ်းရှိကြောင်း ညွှန်ပြသည့် ခန့်မှန်းကြားကာလတစ်ခုကို ဖန်တီးနိုင်သည်။ ဤတန်ဖိုးများအကွာအဝေးကို 95% ခန့်မှန်းသည့်ကြားကာလဟု လူသိများပြီး ခန့်မှန်းတန်ဖိုးအတိအကျကို သိရုံထက် ကျွန်ုပ်တို့အတွက် ပိုမိုအသုံးဝင်ပါသည်။
R တွင် ခန့်မှန်းကြားကာလတစ်ခုကို ဖန်တီးနည်း
R တွင် ခန့်မှန်းသည့်ကြားကာလကို ဖန်တီးပုံဥပမာကိုပြရန်၊ မတူညီသောကားများစွာ၏ဝိသေသလက္ခဏာများအကြောင်း အချက်အလက်များပါရှိသော built-in mtcars dataset ကိုအသုံးပြုပါမည်-
#view first six rows of mtcars head(mtcars) # mpg cyl disp hp drat wt qsec vs am gear carb #Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 #Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 #Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 #Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 #Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 #Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
ပထမဦးစွာ၊ ကျွန်ုပ်တို့သည် ခန့်မှန်းကိန်းရှင်ကိန်းရှင်အဖြစ် disp နှင့် တုံ့ပြန်မှုကိန်းရှင်အဖြစ် mpg ကို အသုံးပြု၍ ရိုးရှင်းသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံကို ဖြည့်သွင်းမည်ဖြစ်သည်။
#fit simple linear regression model model <- lm(mpg ~ disp, data = mtcars) #view summary of fitted model summary(model) #Call: #lm(formula = mpg ~ availability, data = mtcars) # #Residuals: # Min 1Q Median 3Q Max #-4.8922 -2.2022 -0.9631 1.6272 7.2305 # #Coefficients: #Estimate Std. Error t value Pr(>|t|) #(Intercept) 29.599855 1.229720 24.070 < 2e-16 *** #disp -0.041215 0.004712 -8.747 9.38e-10 *** #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # #Residual standard error: 3.251 on 30 degrees of freedom #Multiple R-squared: 0.7183, Adjusted R-squared: 0.709 #F-statistic: 76.51 on 1 and 30 DF, p-value: 9.38e-10
ထို့နောက်၊ disp အတွက် တန်ဖိုးအသစ်သုံးခုအပေါ်အခြေခံ၍ mpg တန်ဖိုးကို ခန့်မှန်းရန် တပ်ဆင်ထားသော regression model ကို အသုံးပြုပါမည်။
#create data frame with three new values for avail new_disp <- data.frame(disp= c(150, 200, 250)) #use the fitted model to predict the value for mpg based on the three new values #for avail predict(model, newdata = new_disp) #1 2 3 #23.41759 21.35683 19.29607
ဤတန်ဖိုးများကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- EPA 150 ရှိသော ကားအသစ်အတွက်၊ စိုင်းစိုင်းခမ်းလှိုင် 23.41759 ရှိမည်ဟု ကျွန်ုပ်တို့ မျှော်လင့်ပါသည်။
- EPA 200 ရှိသော ကားအသစ်အတွက်၊ စိုင်းစိုင်းခမ်းလှိုင် 21.35683 ရှိသည်။
- EPA 250 ရှိသောကားအသစ်အတွက်၊ ၎င်းတွင် mpg 19.29607 ရှိမည်ဟု ကျွန်ုပ်တို့မျှော်လင့်ပါသည်။
ထို့နောက်၊ ဤခန့်မှန်းထားသောတန်ဖိုးများအနီးရှိ ခန့်မှန်းကာလအပိုင်းအခြားများကိုဖန်တီးရန် တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုပါမည်-
#create prediction intervals around the predicted values predict(model, newdata = new_disp, interval = " predict ") # fit lwr upr #1 23.41759 16.62968 30.20549 #2 21.35683 14.60704 28.10662 #3 19.29607 12.55021 26.04194
ဤတန်ဖိုးများကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် နည်းလမ်းမှာ အောက်ပါအတိုင်းဖြစ်သည်။
- EPA 150 ရှိသော ကားအတွက် 95% စိုင်းစိုင်းခမ်းလှိုင် ခန့်မှန်းကြားကာလသည် 16.62968 နှင့် 30.20549 ကြားဖြစ်သည်။
- EPA 200 ရှိသော ကားအတွက် 95% စိုင်းစိုင်းခမ်းလှိုင် ခန့်မှန်းကြားကာလသည် 14.60704 နှင့် 28.10662 ကြားဖြစ်သည်။
- EPA 250 ရှိသော ကားအတွက် 95% စိုင်းစိုင်းခမ်းလှိုင် ခန့်မှန်းကြားကာလသည် 12.55021 နှင့် 26.04194 ကြားဖြစ်သည်။
မူရင်းအားဖြင့် R သည် 95% ခန့်မှန်းမှုကြားကာလကို အသုံးပြုသည်။ သို့သော်၊ ကျွန်ုပ်တို့သည် အဆင့် command ကို အသုံးပြု၍ ကျွန်ုပ်တို့ဆန္ဒအတိုင်း ၎င်းကို ပြောင်းလဲနိုင်သည်။ ဥပမာအားဖြင့်၊ အောက်ပါကုဒ်သည် 99% ခန့်မှန်းမှုကြားကာလများကို ဖန်တီးနည်းကို သရုပ်ပြသည်-
#create 99% prediction intervals around the predicted values predict(model, newdata = new_disp, interval = " predict ", level = 0.99 ) # fit lwr upr #1 23.41759 14.27742 32.55775 #2 21.35683 12.26799 30.44567 #3 19.29607 10.21252 28.37963
99% ခန့်မှန်းမှုကြားကာလများသည် 95% ခန့်မှန်းသည့်ကာလများထက် ပိုကျယ်သည်ကို သတိပြုပါ။ ကြားကာလပိုကျယ်လေ၊ ခန့်မှန်းထားသောတန်ဖိုးကို ပါ၀င်နိုင်ခြေ ပိုများလေဖြစ်သောကြောင့် အဓိပ္ပာယ်ရှိပါသည်။
R တွင် ခန့်မှန်းသည့်ကြားကာလကို မြင်ယောင်မြင်ယောင်ပုံ
အောက်ဖော်ပြပါ ကုဒ်သည် အောက်ပါလုပ်ဆောင်ချက်များဖြင့် ဇယားတစ်ခုကို ဖန်တီးနည်းကို သရုပ်ပြသည်-
- ရရှိနိုင်မှု နှင့် စိုင်းစိုင်းခမ်းလှိုင် အတွက် ဒေတာအချက်များ ဖြန့်ကျက်မှုတစ်ခု
- တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုမျဉ်းအတွက် အပြာလိုင်း
- မီးခိုးရောင်ယုံကြည်မှုကြိုးများ
- အနီရောင် ခန့်မှန်းမှု တီးဝိုင်းများ
#define dataset data <- mtcars[, c("mpg", "disp")] #create simple linear regression model model <- lm(mpg ~ disp, data = mtcars) #use model to create prediction intervals predictions <- predict(model, interval = " predict ") #create dataset that contains original data along with prediction intervals all_data <- cbind(data, predictions) #load ggplot2 library library(ggplot2) #createplot ggplot(all_data, aes(x = disp, y = mpg)) + #define x and y axis variables geom_point() + #add scatterplot points stat_smooth(method = lm) + #confidence bands geom_line(aes(y = lwr), col = "coral2", linetype = "dashed") + #lwr pred interval geom_line(aes(y = upr), col = "coral2", linetype = "dashed") #upr pred interval
ယုံကြည်မှုကြားကာလနှင့် ခန့်မှန်းချက်ကြားကာလကို မည်သည့်အချိန်တွင် အသုံးပြုရမည်နည်း။
ခန့်မှန်းကာလ တစ်ခုသည် တန်ဖိုးတစ်ခု၏ မသေချာမရေရာမှုကို ဖမ်းယူသည်။ ယုံကြည်မှုကြားကာလ တစ်ခုသည် ခန့်မှန်းထားသော ပျမ်းမျှတန်ဖိုးများအနီးရှိ မသေချာမရေရာမှုများကို ဖမ်းယူသည်။ ထို့ကြောင့်၊ ခန့်မှန်းကာလသည် တူညီသောတန်ဖိုးအတွက် ယုံကြည်ချက်ကြားကာလထက် အမြဲပိုကျယ်နေပါမည်။
တိကျသော တစ်ဦးချင်းကြိုတင်ခန့်မှန်းချက်များကို သင်စိတ်ဝင်စားသောအခါတွင် ခန့်မှန်းကာလတစ်ခုကို သင်အသုံးပြုသင့်သည်၊ အဘယ်ကြောင့်ဆိုသော် ယုံကြည်မှုကြားကာလသည် တန်ဖိုးများအကွာအဝေးကို ကျဉ်းမြောင်းလွန်းစွာထုတ်ပေးသောကြောင့် ကြားကာလသည် တန်ဖိုးအမှန်မပါဝင်နိုင်သည့် ဖြစ်နိုင်ခြေပိုများသောကြောင့်ဖြစ်သည်။