စာနယ်ဇင်းစာရင်းအင်းကဘာလဲ။
စာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် အကြောင်းနှစ်ရပ်ကြောင့် ဆုတ်ယုတ်မှုပုံစံများကို ကိုက်ညီသည်-
(၁) တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ရှင်းပြကိန်းရှင်များ နှင့် တုံ့ပြန်မှုကိန်းရှင် ကြား ဆက်နွယ်မှုကို ရှင်းပြပါ ။
(၂) တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ရှင်းပြချက်တစ်ခု၏ တန်ဖိုးများအပေါ် အခြေခံ၍ တုံ့ပြန်မှုကိန်းရှင်တစ်ခု၏ တန်ဖိုးများကို ခန့်မှန်းပါ ။
ကျွန်ုပ်တို့၏ပန်းတိုင်မှာ (၂) တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးများကို ခန့်မှန်းရန်ဖြစ် သောအခါ၊ ကျွန်ုပ်တို့သည် ထိုသို့လုပ်ဆောင်ရန်အတွက် ဖြစ်နိုင်ခြေအကောင်းဆုံးဆုတ်ယုတ်မှုပုံစံကို အသုံးပြုထားကြောင်း သေချာစေလိုပါသည်။
ဒေတာအသစ်တွင် အကောင်းဆုံးခန့်မှန်းချက်ဖြစ်စေမည့် ဆုတ်ယုတ်မှုပုံစံကိုရှာဖွေရန် ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် မက်ထရစ်တစ်ခုသည် ” ခန့်မှန်း ကျန်ရှိသော စတုရန်း များ ” ကို ကိုယ်စားပြုသည့် PRESS ကိန်းဂဏန်း ဖြစ်သည်။
အောက်ပါအတိုင်း တွက်ချက်သည်။
စာနယ်ဇင်း = Σ(e i / (1-h ii )) ၂
ရွှေ-
- e i : i th အကြွင်း။
- h ii : မော်ဒယ်၏ အံဝင်ခွင်ကျရှိမှုအပေါ် စောင့် ကြည့်လေ့လာခြင်း၏ လွှမ်းမိုးမှုအတိုင်းအတာတစ်ခု (“leverage” ဟုခေါ်သည်)။
များပြားသော ဆုတ်ယုတ်မှုပုံစံများကို ပေးထားသည့်အတွက်၊ အနိမ့်ဆုံး PRESS ကို ဒေတာအတွဲအသစ်တွင် အကောင်းဆုံးလုပ်ဆောင်မည့်တစ်ခုအဖြစ် ရွေးချယ်သင့်သည်။
အောက်ပါဥပမာသည် R တွင် မတူညီသော linear regression model သုံးခုအတွက် PRESS ကိန်းဂဏန်းကို တွက်ချက်နည်းကို ပြသထားသည်။
ဥပမာ- PRESS ကိန်းဂဏန်းတွက်ချက်ခြင်း။
ကျွန်ုပ်တို့တွင် ရှင်းပြထားသော variable သုံးခု၊ x1 ၊ x2 နှင့် x3 နှင့် တုံ့ပြန်မှု variable y ပါရှိသည်ဆိုပါစို့။
data <- data.frame (x1 = c(2, 3, 3, 4, 4, 6, 8, 9, 9, 9),
x2 = c(2, 2, 3, 3, 2, 3, 5, 6, 6, 7),
x3 = c(12, 14, 14, 13, 8, 8, 9, 14, 11, 7),
y = c(23, 24, 15, 9, 14, 17, 22, 26, 34, 35))
အောက်ပါကုဒ်သည် lm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ဤဒေတာအတွဲတွင် မတူညီသော ဆုတ်ယုတ်မှုပုံစံသုံးမျိုးကို မည်ကဲ့သို့ အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြသည်-
model1 <- lm(y~x1, data=data) model2 <- lm(y~x1+x2, data=data) model3 <- lm(y~x2+x3, data=data)
အောက်ပါကုဒ်သည် မော်ဒယ်တစ်ခုစီအတွက် PRESS ကိန်းဂဏန်းကို တွက်ချက်နည်းကို ပြသထားသည်။
#create custom function to calculate the PRESS statistic PRESS <- function (model) { i <- residuals (model)/(1 - lm. influence (model)$ hat ) sum(i^2) } #calculate PRESS for model 1 PRESS(model1) [1] 590.2197 #calculate PRESS for model 2 PRESS(model2) [1] 519.6435 #calculate PRESS for model 3 PRESS(model3) [1] 537.7503
အနိမ့်ဆုံး PRESS ကိန်းဂဏန်းရှိသော မော်ဒယ်သည် PRESS ကိန်းဂဏန်း 519.6435 ဖြင့် Model 2 ဖြစ်သည် ။ ထို့ကြောင့်၊ ဒေတာအတွဲအသစ်တစ်ခုအတွက် ကြိုတင်ခန့်မှန်းမှုများပြုလုပ်ရန်အတွက် အသင့်တော်ဆုံးဖြစ်သည့် ဤမော်ဒယ်ကို ကျွန်ုပ်တို့ရွေးချယ်မည်ဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
Simple Linear Regression နိဒါန်း
နှစ်သက်ဖွယ်ကောင်းသော မော်ဒယ်ဆိုသည်မှာ အဘယ်နည်း။
ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။