R တွင်ကျန်ရှိသော histogram ကိုဖန်တီးနည်း
linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေခြင်း ဖြစ်သည်။
ဤယူဆချက်ကို အမြင်အာရုံဖြင့် စိစစ်ရန် နည်းလမ်းတစ်ခုမှာ အကြွင်းအကျန်များ၏ ဟစ်စတိုဂရမ်ကို ဖန်တီးပြီး ဖြန့်ဝေမှုသည် ပုံမှန်ဖြန့်ဝေမှု ၏ အမှတ်ရနေသော “ ခေါင်းလောင်းပုံသဏ္ဍာန်” အတိုင်း ဖြစ်မဖြစ်ကို စောင့်ကြည့်ရန်ဖြစ်သည်။
ဤသင်ခန်းစာသည် R ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်တစ်ခုကို ဖန်တီးနည်း အဆင့်ဆင့် ဥပမာကို ပေးသည်။
အဆင့် 1: ဒေတာကိုဖန်တီးပါ။
ဦးစွာ၊ ဒေတာအတုအချို့ကို ဖန်တီးကြပါစို့-
#make this example reproducible set.seed(0) #createdata x1 <- rnorm(n=100, 2, 1) x2 <- rnorm(100, 4, 3) y <- rnorm(100, 2, 3) data <- data.frame(x1, x2, y) #view first six rows of data head(data) x1 x2 y 1 3.262954 6.3455776 -1.1371530 2 1.673767 1.6696701 -0.6886338 3 3.329799 2.1520303 5.8081615 4 3.272429 4.1397409 3.7815228 5 2.414641 0.6088427 4.3269030 6 0.460050 5.7301563 6.6721111
အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။
ထို့နောက်၊ ကျွန်ုပ်တို့သည် data နှင့် multiple linear regression model ကို ကိုက်ညီပါမည်-
#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=data)
အဆင့် 3- ကျန်ရှိနေသော Histogram တစ်ခုဖန်တီးပါ။
နောက်ဆုံးတွင်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်အကြွင်းအကျန်များ၏ histogram တစ်ခုဖန်တီးရန် ggplot အမြင်အာရုံအတွက် ပက်ကေ့ဂျ်ကို အသုံးပြုပါမည်။
#load ggplot2
library (ggplot2)
#create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
geom_histogram(fill = ' steelblue ', color = ' black ') +
labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

bin argument ကို အသုံးပြု၍ အကြွင်းအကျန်များကို နေရာချရန် bins အရေအတွက်ကိုလည်း သတ်မှတ်နိုင်သည်ကို သတိပြုပါ။
အကွက်များ နည်းပါးလေ၊ အကန့်များ ကျယ်လေ ဟီစတိုဂရမ်တွင် ရှိမည်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် 20 bins ကို သတ်မှတ်နိုင်သည်။
#create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
geom_histogram(bins = 20 , fill = ' steelblue ', color = ' black ') +
labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

သို့မဟုတ် 10 bins များကို သတ်မှတ်နိုင်သည်။
#create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
geom_histogram(bins = 10 , fill = ' steelblue ', color = ' black ') +
labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

အကွက်အရေအတွက်မည်မျှပင် ကျွန်ုပ်တို့သတ်မှတ်ထားပါစေ ကျန်အကြွင်းအကျန်များကို ခန့်မှန်းခြေအားဖြင့် ပုံမှန်အတိုင်း ဖြန့်ဝေနေကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။
ပုံမှန်အခြေအနေအတွက် စမ်းသပ်ရန် Shapiro-Wilk၊ Kolmogorov-Smirnov သို့မဟုတ် Jarque-Bera ကဲ့သို့သော တရားဝင် ကိန်းဂဏန်းစမ်းသပ်မှုကိုလည်း လုပ်ဆောင်နိုင်သည်။
သို့သော်၊ ဤစမ်းသပ်မှုများသည် နမူနာအရွယ်အစားကြီးများအတွက် ထိလွယ်ရှလွယ်ဖြစ်သည်- ဆိုလိုသည်မှာ၊ နမူနာအရွယ်အစားကြီးသောအခါ ကျန်ရှိသောအရာများသည် ပုံမှန်မဟုတ်ကြောင်း မကြာခဏ ကောက်ချက်ချလေ့ရှိသည်။
ဤအကြောင်းကြောင့်၊ အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်ဖန်တီးခြင်းဖြင့် ပုံမှန်အခြေအနေကို အကဲဖြတ်ရန် မကြာခဏ ပိုမိုလွယ်ကူသည်။