R တွင်ကျန်ရှိသော histogram ကိုဖန်တီးနည်း


linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေခြင်း ဖြစ်သည်။

ဤယူဆချက်ကို အမြင်အာရုံဖြင့် စိစစ်ရန် နည်းလမ်းတစ်ခုမှာ အကြွင်းအကျန်များ၏ ဟစ်စတိုဂရမ်ကို ဖန်တီးပြီး ဖြန့်ဝေမှုသည် ပုံမှန်ဖြန့်ဝေမှု ၏ အမှတ်ရနေသော “ ခေါင်းလောင်းပုံသဏ္ဍာန်” အတိုင်း ဖြစ်မဖြစ်ကို စောင့်ကြည့်ရန်ဖြစ်သည်။

ဤသင်ခန်းစာသည် R ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်တစ်ခုကို ဖန်တီးနည်း အဆင့်ဆင့် ဥပမာကို ပေးသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ဦးစွာ၊ ဒေတာအတုအချို့ကို ဖန်တီးကြပါစို့-

 #make this example reproducible
set.seed(0)

#createdata
x1 <- rnorm(n=100, 2, 1)
x2 <- rnorm(100, 4, 3)
y <- rnorm(100, 2, 3)
data <- data.frame(x1, x2, y)

#view first six rows of data
head(data)

        x1 x2 y
1 3.262954 6.3455776 -1.1371530
2 1.673767 1.6696701 -0.6886338
3 3.329799 2.1520303 5.8081615
4 3.272429 4.1397409 3.7815228
5 2.414641 0.6088427 4.3269030
6 0.460050 5.7301563 6.6721111

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် data နှင့် multiple linear regression model ကို ကိုက်ညီပါမည်-

 #fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=data)

အဆင့် 3- ကျန်ရှိနေသော Histogram တစ်ခုဖန်တီးပါ။

နောက်ဆုံးတွင်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်အကြွင်းအကျန်များ၏ histogram တစ်ခုဖန်တီးရန် ggplot အမြင်အာရုံအတွက် ပက်ကေ့ဂျ်ကို အသုံးပြုပါမည်။

 #load ggplot2
library (ggplot2)

#create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
    geom_histogram(fill = ' steelblue ', color = ' black ') +
    labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

R တွင် အကြွင်းအကျန်များ၏ ဟစ်စတိုဂရမ်

bin argument ကို အသုံးပြု၍ အကြွင်းအကျန်များကို နေရာချရန် bins အရေအတွက်ကိုလည်း သတ်မှတ်နိုင်သည်ကို သတိပြုပါ။

အကွက်များ နည်းပါးလေ၊ အကန့်များ ကျယ်လေ ဟီစတိုဂရမ်တွင် ရှိမည်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် 20 bins ကို သတ်မှတ်နိုင်သည်။

 #create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
    geom_histogram(bins = 20 , fill = ' steelblue ', color = ' black ') +
    labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ') 

R တွင် ကျန်ရှိသော ဟစ်စတိုဂရမ်

သို့မဟုတ် 10 bins များကို သတ်မှတ်နိုင်သည်။

 #create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
    geom_histogram(bins = 10 , fill = ' steelblue ', color = ' black ') +
    labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ') 

အကွက်အရေအတွက်မည်မျှပင် ကျွန်ုပ်တို့သတ်မှတ်ထားပါစေ ကျန်အကြွင်းအကျန်များကို ခန့်မှန်းခြေအားဖြင့် ပုံမှန်အတိုင်း ဖြန့်ဝေနေကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ပုံမှန်အခြေအနေအတွက် စမ်းသပ်ရန် Shapiro-Wilk၊ Kolmogorov-Smirnov သို့မဟုတ် Jarque-Bera ကဲ့သို့သော တရားဝင် ကိန်းဂဏန်းစမ်းသပ်မှုကိုလည်း လုပ်ဆောင်နိုင်သည်။

သို့သော်၊ ဤစမ်းသပ်မှုများသည် နမူနာအရွယ်အစားကြီးများအတွက် ထိလွယ်ရှလွယ်ဖြစ်သည်- ဆိုလိုသည်မှာ၊ နမူနာအရွယ်အစားကြီးသောအခါ ကျန်ရှိသောအရာများသည် ပုံမှန်မဟုတ်ကြောင်း မကြာခဏ ကောက်ချက်ချလေ့ရှိသည်။

ဤအကြောင်းကြောင့်၊ အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်ဖန်တီးခြင်းဖြင့် ပုံမှန်အခြေအနေကို အကဲဖြတ်ရန် မကြာခဏ ပိုမိုလွယ်ကူသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်