စာနယ်ဇင်းစာရင်းအင်းကဘာလဲ။


စာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် အကြောင်းနှစ်ရပ်ကြောင့် ဆုတ်ယုတ်မှုပုံစံများကို ကိုက်ညီသည်-

(၁) တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ရှင်းပြကိန်းရှင်များ နှင့် တုံ့ပြန်မှုကိန်းရှင် ကြား ဆက်နွယ်မှုကို ရှင်းပြပါ

(၂) တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ရှင်းပြချက်တစ်ခု၏ တန်ဖိုးများအပေါ် အခြေခံ၍ တုံ့ပြန်မှုကိန်းရှင်တစ်ခု၏ တန်ဖိုးများကို ခန့်မှန်းပါ

ကျွန်ုပ်တို့၏ပန်းတိုင်မှာ (၂) တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးများကို ခန့်မှန်းရန်ဖြစ် သောအခါ၊ ကျွန်ုပ်တို့သည် ထိုသို့လုပ်ဆောင်ရန်အတွက် ဖြစ်နိုင်ခြေအကောင်းဆုံးဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုထားကြောင်း သေချာစေလိုပါသည်။

ဒေတာအသစ်တွင် အကောင်းဆုံးခန့်မှန်းချက်ဖြစ်စေမည့် ဆုတ်ယုတ်မှုပုံစံကိုရှာဖွေရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် မက်ထရစ်တစ်ခုသည် ” ခန့်မှန်း ကျန်ရှိသော စတုရန်း များ ” ကို ကိုယ်စားပြုသည့် PRESS ကိန်းဂဏန်း ဖြစ်သည်။

အောက်ပါအတိုင်း တွက်ချက်သည်။

စာနယ်ဇင်း = Σ(e i / (1-h ii ))

ရွှေ-

  • e i : i th အကြွင်း။
  • h ii : မော်ဒယ်၏ အံဝင်ခွင်ကျရှိမှုအပေါ် စောင့် ကြည့်လေ့လာခြင်း၏ လွှမ်းမိုးမှုအတိုင်းအတာတစ်ခု (“leverage” ဟုခေါ်သည်)။

များပြားသော ဆုတ်ယုတ်မှုပုံစံများကို ပေးထားသည့်အတွက်၊ အနိမ့်ဆုံး PRESS ကို ဒေတာအတွဲအသစ်တွင် အကောင်းဆုံးလုပ်ဆောင်မည့်တစ်ခုအဖြစ် ရွေးချယ်သင့်သည်။

အောက်ပါဥပမာသည် R တွင် မတူညီသော linear regression model သုံးခုအတွက် PRESS ကိန်းဂဏန်းကို တွက်ချက်နည်းကို ပြသထားသည်။

ဥပမာ- PRESS ကိန်းဂဏန်းတွက်ချက်ခြင်း။

ကျွန်ုပ်တို့တွင် ရှင်းပြထားသော variable သုံးခု၊ x1x2 နှင့် x3 နှင့် တုံ့ပြန်မှု variable y ပါရှိသည်ဆိုပါစို့။

 data <- data.frame (x1 = c(2, 3, 3, 4, 4, 6, 8, 9, 9, 9),
                   x2 = c(2, 2, 3, 3, 2, 3, 5, 6, 6, 7),
                   x3 = c(12, 14, 14, 13, 8, 8, 9, 14, 11, 7),
                    y = c(23, 24, 15, 9, 14, 17, 22, 26, 34, 35))

အောက်ပါကုဒ်သည် lm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဤဒေတာအတွဲတွင် မတူညီသော ဆုတ်ယုတ်မှုပုံစံသုံးမျိုးကို မည်ကဲ့သို့ အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြသည်-

 model1 <- lm(y~x1, data=data)

model2 <- lm(y~x1+x2, data=data)

model3 <- lm(y~x2+x3, data=data)

အောက်ပါကုဒ်သည် မော်ဒယ်တစ်ခုစီအတွက် PRESS ကိန်းဂဏန်းကို တွက်ချက်နည်းကို ပြသထားသည်။

 #create custom function to calculate the PRESS statistic
PRESS <- function (model) {
    i <- residuals (model)/(1 - lm. influence (model)$ hat )
    sum(i^2)
}

#calculate PRESS for model 1
PRESS(model1)

[1] 590.2197

#calculate PRESS for model 2
PRESS(model2)

[1] 519.6435

#calculate PRESS for model 3
PRESS(model3)

[1] 537.7503

အနိမ့်ဆုံး PRESS ကိန်းဂဏန်းရှိသော မော်ဒယ်သည် PRESS ကိန်းဂဏန်း 519.6435 ဖြင့် Model 2 ဖြစ်သည် ။ ထို့ကြောင့်၊ ဒေတာအတွဲအသစ်တစ်ခုအတွက် ကြိုတင်ခန့်မှန်းမှုများပြုလုပ်ရန်အတွက် အသင့်တော်ဆုံးဖြစ်သည့် ဤမော်ဒယ်ကို ကျွန်ုပ်တို့ရွေးချယ်မည်ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

Simple Linear Regression နိဒါန်း
နှစ်သက်ဖွယ်ကောင်းသော မော်ဒယ်ဆိုသည်မှာ အဘယ်နည်း။
ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်