အကောင်း သို့မဟုတ် အဆိုး ကြွင်းကျန်သော ကြံစည်မှု ဆိုသည်မှာ အဘယ်နည်း။
ဆုတ်ယုတ်မှုခွဲခြမ်းစိတ်ဖြာမှုတွင် ကျန်ရှိသောကွက်ကွက် သည် x-ဝင်ရိုးပေါ်ရှိ ဆုတ်ယုတ်မှုပုံစံ၏ တပ်ဆင်တန်ဖိုးများနှင့် y-ဝင်ရိုးတစ်လျှောက် မော်ဒယ်၏အကြွင်းအကျန်များကို ပြသသည့်ကွက်ကွက်အမျိုးအစားတစ်ခုဖြစ်သည်။
ကျန်နေသော အပြင်အဆင်ကို အမြင်အာရုံဖြင့် စစ်ဆေးသောအခါ၊ အပြင်အဆင်သည် “ ကောင်း” သို့မဟုတ် “ ဆိုး” ရှိ၊ မရှိ ဆုံးဖြတ်ရန် အရာနှစ်ခုကို ယေဘုယျအားဖြင့် ရှာကြည့်သည်-
1. အကြွင်းအကျန်များသည် ရှင်းလင်းပြတ်သားသောလမ်းကြောင်းကို ပြသပါသလား။
- “ကောင်းသော” အကြွင်းအကျန်ကွက်များတွင်၊ အကြွင်းအကျန်များသည် ရှင်းလင်းပြတ်သားသောလမ်းကြောင်းကို မပြပါ။
- ကျန်ရှိသော “ ဆိုး” ကွက်တွင်၊ အကြွင်းအကျန်များသည် မျဉ်းကွေး သို့မဟုတ် လှိုင်းကဲ့သို့ ပုံစံအချို့ရှိသည်။ ၎င်းသည် ကျွန်ုပ်တို့အသုံးပြုခဲ့သည့် ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့် သင့်လျော်သော ကိုက်ညီမှုမရှိပါက ညွှန်ပြပါသည်။
2. အကြွင်းအကျန်များသည် စနစ်တကျကွဲလွဲမှု တိုးလာသလား၊
- “ ကောင်းသော” ကျန်ရှိသောကွက်တစ်ခုတွင်၊ အကြွင်းအကျန်များကို စနစ်တကျ အတိုး သို့မဟုတ် လျော့ချခြင်းမရှိဘဲ ကွဲပြားမှုမရှိဘဲ သုညအနီးတွင် ကျပန်းဖြန့်ကျဲနေပါသည်။
- ကျန်ရှိသော “ ဆိုး” ကွက်တွင်၊ အကြွင်းအကျန်များ၏ ကွဲလွဲမှုသည် စနစ်တကျ တိုးသည် သို့မဟုတ် လျော့သွားသည်။
ကျန်ရှိသောကွက်ကွက်တစ်ခုအား အဆင့်သတ်မှတ်ထားလျှင် “ ကောင်းသည်” ဆိုလျှင် regression model ၏ရလဒ်များကို ယုံကြည်နိုင်ပြီး model coefficients ကို အဓိပ္ပာယ်ပြန်ဆိုရန် လုံခြုံသည်ဟု ဆိုလိုသည်။
သို့သော်၊ ကျန်ရှိသောကွက်ကွက်တစ်ခုကို အဆင့်သတ်မှတ်ထားလျှင် “ ဆိုးရွားသည်” ဆိုလျှင် မော်ဒယ်ရလဒ်များသည် ယုံကြည်စိတ်ချရခြင်းမရှိကြောင်း ဆိုလိုပြီး ကျွန်ုပ်တို့သည် မတူညီသော ဆုတ်ယုတ်မှုပုံစံကို ဒေတာနှင့် ကိုက်ညီရန် လိုအပ်ပါသည်။
အောက်ဖော်ပြပါနမူနာများသည် လက်တွေ့တွင် “ကောင်း” နှင့် “ဆိုး” ဟူသော ကျန်နေသော ကွက်ကွက်များကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံကို ရှင်းပြထားသည်။
ဥပမာ 1- “ ကောင်း” လက်ကျန်ခြေရာကောက်
ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံဝင်ခွင်ကျဖြစ်ပြီး အောက်ဖော်ပြပါ အကြွင်းအကျန်များကို ရယူမည်ဆိုပါစို့။

ဤအရာသည် “ ကောင်းသော” ကျန်နေသေးသော ကြံစည်မှုဟုတ်မဟုတ် ဆုံးဖြတ်ရန် အောက်ပါမေးခွန်းနှစ်ခုကို ကျွန်ုပ်တို့ဖြေနိုင်သည်-
1. အကြွင်းအကျန်များသည် ရှင်းလင်းပြတ်သားသောလမ်းကြောင်းကို ပြသပါသလား။
နံပါတ်။ အကြွင်းအကျန်များသည် ရှင်းရှင်းလင်းလင်းမရှိသော ပုံစံမရှိဘဲ သုညတွင် ကျပန်းကျပန်း ပြန့်ကျဲနေသည်။
2. အကြွင်းအကျန်များသည် စနစ်တကျကွဲလွဲမှု တိုးလာသလား၊
နံပါတ်။ ကျန်ရှိသည့်အရာများသည် တပ်ဆင်ထားသောတန်ဖိုးများ၏ အဆင့်တစ်ခုစီတွင် အကြွင်းအကျန်များနှင့် သုညတန်ဖိုးကြားအကွာအဝေး) မျှတသော ကိန်းသေကွဲလွဲမှုရှိသည်။
ဒီမေးခွန်းနှစ်ခုစလုံးကို “ No” လို့ဖြေတဲ့အတွက်၊ ဒါကို “ ကောင်း” တဲ့ကျန်နေတဲ့ ဇာတ်ကွက်တစ်ခုလို့ မှတ်ယူမှာပါ။
ထို့ကြောင့်၊ ကျွန်ုပ်တို့သည် regression model ၏ရလဒ်များကို ယုံကြည်နိုင်ပြီး model coefficients ကို ဘေးကင်းစွာ အနက်ပြန်ဆိုနိုင်ပါသည်။
ဥပမာ 2- ရှင်းရှင်းလင်းလင်း စံနမူနာပါသော “ ဆိုး” ကျန်နေသော ကြံစည်မှု
ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံဝင်ခွင်ကျဖြစ်ပြီး အောက်ဖော်ပြပါ အကြွင်းအကျန်များကို ရယူမည်ဆိုပါစို့။

ဤအရာသည် “ ကောင်းသော” ကျန်နေသေးသော ကြံစည်မှုဟုတ်မဟုတ် ဆုံးဖြတ်ရန် အောက်ပါမေးခွန်းနှစ်ခုကို ကျွန်ုပ်တို့ဖြေနိုင်သည်-
1. အကြွင်းအကျန်များသည် ရှင်းလင်းပြတ်သားသောလမ်းကြောင်းကို ပြသပါသလား။
ဟုတ်ပါတယ် ။ အကြွင်းအကျန်များသည် ကွေးသောပုံစံကို ပြသသည်။
2. အကြွင်းအကျန်များသည် စနစ်တကျကွဲလွဲမှု တိုးလာသလား၊
ဟုတ်ပါတယ် ။ အကြွင်းအကျန်များသည် တပ်ဆင်ထားသောတန်ဖိုးများ၏ မတူညီသောအဆင့်များတွင် ကွဲပြားမှုအဆင့်များရှိသည်။
ဤမေးခွန်းများထဲမှ အနည်းဆုံးတစ်ခုအား “ Yes” ဟု ဖြေသောကြောင့်၊ ဤအရာသည် ကျန်နေသေးသော “ ဆိုး” ကွက်တစ်ခုဟု မှတ်ယူပါမည်။
ဆိုလိုသည်မှာ ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာနှင့် အံဝင်ခွင်ကျမဖြစ်ပေ။
အထူးသဖြင့်၊ ကျန်ရှိသောကွက်လပ်ရှိ မျဉ်းကွေးပုံစံသည် linear regression model သည် data နှင့်မကိုက်ညီကြောင်း ညွှန်ပြနေပြီး quadratic regression model သည် ပိုမိုကောင်းမွန်သောအလုပ်ဖြစ်နိုင်သည်ဟု ဖော်ပြသည်။
ဥပမာ 3- ကွဲလွဲမှု တိုးလာနေသော “ မကောင်းတဲ့” ကျန်နေတဲ့ ကြံစည်မှု
ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံဝင်ခွင်ကျဖြစ်ပြီး အောက်ဖော်ပြပါ အကြွင်းအကျန်များကို ရယူမည်ဆိုပါစို့။

ဤအရာသည် “ ကောင်းသော” ကျန်နေသေးသော ကြံစည်မှုဟုတ်မဟုတ် ဆုံးဖြတ်ရန် အောက်ပါမေးခွန်းနှစ်ခုကို ကျွန်ုပ်တို့ဖြေနိုင်သည်-
1. အကြွင်းအကျန်များသည် ရှင်းလင်းပြတ်သားသောလမ်းကြောင်းကို ပြသပါသလား။
နံပါတ်၊ အကြွင်းအကျန်များတွင် ရှင်းလင်းပြတ်သားသော လမ်းကြောင်းမရှိပါ။
2. အကြွင်းအကျန်များသည် စနစ်တကျကွဲလွဲမှု တိုးလာသလား၊
ဟုတ်ပါတယ် ။ တပ်ဆင်ထားသော တန်ဖိုးများ တိုးလာသည်နှင့်အမျှ အကြွင်းအကျန်များ၏ ကွဲလွဲမှု တိုးလာသည်။
ဤမေးခွန်းများထဲမှ အနည်းဆုံးတစ်ခုအား “ Yes” ဟု ဖြေသောကြောင့်၊ ဤအရာသည် ကျန်နေသေးသော “ ဆိုး” ကွက်တစ်ခုဟု မှတ်ယူပါမည်။
ဤအထူးဥပမာတွင်၊ အကြွင်းအကျန်များသည် တပ်ဆင်ထားသောတန်ဖိုးများ၏ မတူညီသောအဆင့်များတွင် ကျန်အကြွင်းအကျန်များ၏ မညီမျှသောကွဲလွဲမှုကို ရည်ညွှန်းသည့် ဟေတီ ရိုစီဒတ်စတီစီ (heteroscedasticity) ခံစားရသည်။
ဆိုလိုသည်မှာ ဆုတ်ယုတ်မှုပုံစံ၏ ရလဒ်များသည် ယုံကြည်စိတ်ချနိုင်မည်မဟုတ်ပေ။
ဆုတ်ယုတ်မှုပုံစံတွင် heteroskedasticity ပြဿနာကို ဖြေရှင်းရန် မတူညီသောနည်းလမ်းများကို လေ့လာရန် ဤဆောင်းပါးကို ကိုးကားပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ကွဲပြားသော စာရင်းအင်းဆော့ဖ်ဝဲကို အသုံးပြု၍ ကျန်ရှိသောကွက်ကွက်များကို ဖန်တီးနည်းကို ရှင်းပြသည်-
R တွင်ကျန်ရှိသောကွက်ကွက်ဖန်တီးနည်း
Python တွင် Residual Plot ဖန်တီးနည်း
Excel တွင် Residual Plot ဖန်တီးနည်း
SAS တွင်ကျန်ရှိသောကြံစည်မှုတစ်ခုဖန်တီးနည်း