စာရင်းအင်းများတွင် သြဇာညောင်းသော စောင့်ကြည့်လေ့လာခြင်းဆိုသည်မှာ အဘယ်နည်း။


ကိန်းဂဏန်းစာရင်းဇယားများတွင် သြဇာကြီးမားသော စူးစမ်းလေ့လာမှု သည် ဖယ်ရှားလိုက်သောအခါ ဆုတ်ယုတ်မှုပုံစံ၏ ဖော်ကိန်း ခန့်မှန်းချက်များကို သိသိသာသာ ပြောင်းလဲသွားစေသည့် ဒေတာအစုတစ်ခုမှ စူးစမ်းလေ့လာမှုတစ်ခုဖြစ်သည်။

မှတ်သားမှုများ၏လွှမ်းမိုးမှုကိုတိုင်းတာရန်အသုံးအများဆုံးနည်းလမ်းမှာ i th observation ကိုဖယ်ရှားလိုက်သောအခါ regression model တစ်ခုတွင်တပ်ဆင်ထားသောတန်ဖိုးများမည်မျှရှိသည်ကိုတိုင်းတာသည့် Cook’s distance ကိုအသုံးပြုခြင်းဖြစ်သည်။

ယေဘူယျအားဖြင့် 1 ထက် ပိုကြီးသော Cook အကွာအဝေးရှိ မည်သည့် မှတ်သားမှုကိုမဆို မြင့်မားသော ရှုမြင်မှုဟု သတ်မှတ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် အလားအလာရှိသော စူးစမ်းလေ့လာမှုများကို ရှာဖွေရန် ပေးထားသော ဒေတာအတွဲအတွက် Cook ၏ အကွာအဝေးကို တွက်ချက်ပုံနှင့် အဓိပ္ပာယ်ဖွင့်ဆိုပုံကို ပြသထားသည်။

ဥပမာ- သြဇာရှိသော လေ့လာတွေ့ရှိချက်များကို ထောက်လှမ်းခြင်း။

ကျွန်ုပ်တို့တွင် တန်ဖိုး 14 ခုရှိသည့် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။

ယခု ကျွန်ုပ်တို့သည် ရိုးရှင်းသော linear regression model နှင့် ကိုက်ညီသည်ဆိုပါစို့။ ဆုတ်ယုတ်မှုရလဒ်ကို အောက်တွင်ဖော်ပြထားသည်။

စာရင်းအင်းဆော့ဖ်ဝဲကို အသုံးပြု၍ လေ့လာမှုတစ်ခုစီအတွက် Cook ၏ အကွာအဝေးအတွက် အောက်ပါတန်ဖိုးများကို တွက်ချက်နိုင်သည်-

နောက်ဆုံးလေ့လာချက်သည် Cook ၏အကွာအဝေးအတွက် 1 ထက် သိသိသာသာကြီးသောတန်ဖိုးရှိကြောင်း သတိပြုပါ၊ ၎င်းသည် ကျွန်ုပ်တို့အား ဩဇာသက်ရောက်မှုရှိသော စူးစမ်းမှုတစ်ခုဖြစ်ကြောင်း ပြောပြသည်။

ကျွန်ုပ်တို့သည် ဤတန်ဖိုးကို dataset မှဖယ်ရှားပြီး ရိုးရှင်းသော linear regression model အသစ်နှင့် ကိုက်ညီသည်ဆိုပါစို့။ ဤမော်ဒယ်၏ output ကိုအောက်တွင်ဖော်ပြထားသည်:

intercept နှင့် x အတွက် regression coefficients နှစ်ခုလုံး သိသိသာသာ ပြောင်းလဲသွားသည်ကို သတိပြုပါ။ ဒေတာအတွဲမှ သြဇာညောင်းသော စောင့်ကြည့်မှုကို ဖယ်ရှားခြင်းသည် တပ်ဆင်ထားသော ဆုတ်ယုတ်မှုပုံစံကို လုံးဝပြောင်းလဲသွားစေကြောင်း ၎င်းက ကျွန်ုပ်တို့အား ပြောပြသည်။

အောက်ပါဂရပ်များသည် ဤတပ်ဆင်ထားသော ဆုတ်ယုတ်မှုညီမျှခြင်းနှစ်ခုကြား ခြားနားချက်ကို ပြသည်-

သြဇာကြီးမားသော ရှုထောင့်တစ်ခုမှ ဆုတ်ယုတ်မှုမျဉ်းကို မည်မျှပြောင်းလဲသည်ကို သတိပြုပါ။ ဤလေ့လာချက်ကို ဖယ်ရှားခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် ဒေတာနှင့် ပိုမိုနီးစပ်သော ဆုတ်ယုတ်မှုမျဉ်းကို ရှာဖွေနိုင်ခဲ့ပါသည်။

မှတ်ချက်များ

သြဇာရှိနိုင်ချေရှိသော စူးစမ်းမှုများကို ဖော်ထုတ်ရန် Cook ၏ အကွာအဝေးကို အသုံးပြုသင့်ကြောင်း မှတ်သားထားရန် အရေးကြီးပါသည်။ သို့သော်၊ စူးစမ်းမှုတစ်ခုသည် ဩဇာရှိသောကြောင့် ၎င်းကို dataset မှဖယ်ရှားသင့်သည်ဟု မဆိုလိုပါ။

ပထမဦးစွာ၊ လေ့လာကြည့်ရှုမှုသည် ဒေတာထည့်သွင်းမှုအမှား သို့မဟုတ် အခြားထူးဆန်းသည့်ဖြစ်ရပ်တစ်ခု၏ ရလဒ်မဟုတ်ကြောင်း သင်စစ်ဆေးရန်လိုအပ်သည်။ တရားဝင်တန်ဖိုးတစ်ခုဖြစ်လာပါက၊ ၎င်းကို အောက်ပါနည်းလမ်းများထဲမှတစ်ခုဖြင့် ကုသရန် သင်ဆုံးဖြတ်နိုင်သည်-

  • ၎င်းကို ဒေတာအတွဲမှ ဖယ်ရှားပါ။
  • ၎င်းကို dataset တွင်ထားခဲ့ပါ။
  • ၎င်းကို ပျမ်းမျှ သို့မဟုတ် ပျမ်းမျှတန်ဖိုးကဲ့သို့ အခြားတန်ဖိုးတစ်ခုဖြင့် အစားထိုးပါ။

သင်၏ သီးခြားအခြေအနေအပေါ်မူတည်၍ ဤရွေးချယ်မှုများထဲမှ တစ်ခုသည် အခြားအရာများထက် ပိုမိုအဓိပ္ပာယ်ရှိနိုင်ပါသည်။

လက်တွေ့မှာ ထမင်းချက်သူရဲ့ အကွာအဝေးကို ဘယ်လိုတွက်ရမလဲ

အောက်ပါသင်ခန်းစာများသည် Python နှင့် R ရှိ ပေးထားသည့်ဒေတာအတွဲအတွက် Cook ၏အကွာအဝေးကို တွက်ချက်နည်းကို ရှင်းပြသည်-

Python တွင် Cook ၏အကွာအဝေးကိုဘယ်လိုတွက်မလဲ။
R ဖြင့် Cook ၏ အကွာအဝေးကို တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်