R တွင်ကျန်ရှိသော histogram ကိုဖန်တီးနည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 26, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

linear regression ၏ အဓိက ယူဆချက် တစ်ခုမှာ အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေခြင်း ဖြစ်သည်။

ဤယူဆချက်ကို အမြင်အာရုံဖြင့် စိစစ်ရန် နည်းလမ်းတစ်ခုမှာ အကြွင်းအကျန်များ၏ ဟစ်စတိုဂရမ်ကို ဖန်တီးပြီး ဖြန့်ဝေမှုသည် ပုံမှန်ဖြန့်ဝေမှု ၏ အမှတ်ရနေသော “ ခေါင်းလောင်းပုံသဏ္ဍာန်” အတိုင်း ဖြစ်မဖြစ်ကို စောင့်ကြည့်ရန်ဖြစ်သည်။

ဤသင်ခန်းစာသည် R ရှိ ဆုတ်ယုတ်မှုပုံစံအတွက် အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်တစ်ခုကို ဖန်တီးနည်း အဆင့်ဆင့် ဥပမာကို ပေးသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ဦးစွာ၊ ဒေတာအတုအချို့ကို ဖန်တီးကြပါစို့-

 #make this example reproducible
set.seed(0)

#createdata
x1 <- rnorm(n=100, 2, 1)
x2 <- rnorm(100, 4, 3)
y <- rnorm(100, 2, 3)
data <- data.frame(x1, x2, y)

#view first six rows of data
head(data)

        x1 x2 y
1 3.262954 6.3455776 -1.1371530
2 1.673767 1.6696701 -0.6886338
3 3.329799 2.1520303 5.8081615
4 3.272429 4.1397409 3.7815228
5 2.414641 0.6088427 4.3269030
6 0.460050 5.7301563 6.6721111

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် data နှင့် multiple linear regression model ကို ကိုက်ညီပါမည်-

 #fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=data)

အဆင့် 3- ကျန်ရှိနေသော Histogram တစ်ခုဖန်တီးပါ။

နောက်ဆုံးတွင်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်အကြွင်းအကျန်များ၏ histogram တစ်ခုဖန်တီးရန် ggplot အမြင်အာရုံအတွက် ပက်ကေ့ဂျ်ကို အသုံးပြုပါမည်။

 #load ggplot2
library (ggplot2)

#create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
    geom_histogram(fill = ' steelblue ', color = ' black ') +
    labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

R တွင် အကြွင်းအကျန်များ၏ ဟစ်စတိုဂရမ်

bin argument ကို အသုံးပြု၍ အကြွင်းအကျန်များကို နေရာချရန် bins အရေအတွက်ကိုလည်း သတ်မှတ်နိုင်သည်ကို သတိပြုပါ။

အကွက်များ နည်းပါးလေ၊ အကန့်များ ကျယ်လေ ဟီစတိုဂရမ်တွင် ရှိမည်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် 20 bins ကို သတ်မှတ်နိုင်သည်။

 #create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
    geom_histogram(bins = 20 , fill = ' steelblue ', color = ' black ') +
    labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

R တွင် ကျန်ရှိသော ဟစ်စတိုဂရမ်

သို့မဟုတ် 10 bins များကို သတ်မှတ်နိုင်သည်။

 #create histogram of residuals
ggplot(data = data, aes (x = model$residuals)) +
    geom_histogram(bins = 10 , fill = ' steelblue ', color = ' black ') +
    labs(title = ' Histogram of Residuals ', x = ' Residuals ', y = ' Frequency ')

အကွက်အရေအတွက်မည်မျှပင် ကျွန်ုပ်တို့သတ်မှတ်ထားပါစေ ကျန်အကြွင်းအကျန်များကို ခန့်မှန်းခြေအားဖြင့် ပုံမှန်အတိုင်း ဖြန့်ဝေနေကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ပုံမှန်အခြေအနေအတွက် စမ်းသပ်ရန် Shapiro-Wilk၊ Kolmogorov-Smirnov သို့မဟုတ် Jarque-Bera ကဲ့သို့သော တရားဝင် ကိန်းဂဏန်းစမ်းသပ်မှုကိုလည်း လုပ်ဆောင်နိုင်သည်။

သို့သော်၊ ဤစမ်းသပ်မှုများသည် နမူနာအရွယ်အစားကြီးများအတွက် ထိလွယ်ရှလွယ်ဖြစ်သည်- ဆိုလိုသည်မှာ၊ နမူနာအရွယ်အစားကြီးသောအခါ ကျန်ရှိသောအရာများသည် ပုံမှန်မဟုတ်ကြောင်း မကြာခဏ ကောက်ချက်ချလေ့ရှိသည်။

ဤအကြောင်းကြောင့်၊ အကြွင်းအကျန်များ၏ ဟီစတိုဂရမ်ဖန်တီးခြင်းဖြင့် ပုံမှန်အခြေအနေကို အကဲဖြတ်ရန် မကြာခဏ ပိုမိုလွယ်ကူသည်။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

အဆင့် 2- ဆုတ်ယုတ်မှုပုံစံကို အံကိုက်လုပ်ပါ။

အဆင့် 3- ကျန်ရှိနေသော Histogram တစ်ခုဖန်တီးပါ။

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။