ပြုပြင်ထားသော z ရမှတ်ဆိုသည်မှာ အဘယ်နည်း။ (အဓိပ္ပါယ် & #038; ဥပမာ)


ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ z-score သည် စံနှုန်း တစ်ခုမှ တန်ဖိုးတစ်ခုသွေဖည်မှုမည်မျှရှိသည်ကို ပြောပြသည်။ z-score ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုသည်-

Z ရမှတ် = (x i – μ) / σ

ရွှေ-

  • x i : ဒေတာတန်ဖိုးတစ်ခုတည်း
  • μ: ဒေတာအစုံ၏ပျမ်းမျှ
  • σ- ဒေတာအတွဲ၏ စံသွေဖည်မှု

Z ရမှတ်များကို ဒေတာအတွဲတစ်ခုတွင် အစွန်းအထင်းများကို သိရှိရန် အသုံးပြုလေ့ရှိသည်။ ဥပမာအားဖြင့်၊ -3 ထက်နည်းသော သို့မဟုတ် 3 ထက်ကြီးသော z-score ရှိသော ရှုမြင်ချက်များကို မကြာခဏ အကွာအဝေးဟု သတ်မှတ်သည်။

သို့သော်၊ z-score များသည် ပုံမှန်မဟုတ်သော ကြီးမားသော သို့မဟုတ် သေးငယ်သောဒေတာတန်ဖိုးများကြောင့် ထိခိုက်နိုင်သည်။ ထို့ကြောင့် outliers များကိုရှာဖွေရန် ပိုမိုခိုင်မာသောနည်းလမ်းမှာ အောက်ပါအတိုင်းတွက်ချက်ထားသော မွမ်းမံထားသော z-score ကို အသုံးပြုခြင်းဖြစ်သည်-

မွမ်းမံထားသော z-ရမှတ် = 0.6745 (x i – x̃) / MAD

ရွှေ-

  • x i : ဒေတာတန်ဖိုးတစ်ခုတည်း
  • x̃- ဒေတာအတွဲ၏ ပျမ်းမျှ
  • MAD- ဒေတာအတွဲ၏ ပျမ်းမျှအကြွင်းမဲ့သွေဖည်မှု

မွမ်းမံထားသော z-score သည် ပျမ်းမျှအားဖြင့် z-scores များကို တွက်ချက်ရန် အလယ်အလတ်ကို အသုံးပြုထားသောကြောင့်၊ outliers များမှ လွှမ်းမိုးခံရသည်ဟု သိထားသည့် mean နှင့် ဆန့်ကျင်ဘက်ဖြစ်သည်။

Iglewicz နှင့် Hoaglin တို့က -3.5 အောက် သို့မဟုတ် 3.5 ထက် ပိုနည်းသော မွမ်းမံထားသော z-ရမှတ်များပါရှိသော တန်ဖိုးများကို ဖြစ်နိုင်ချေရှိသော အကွာအဝေးများအဖြစ် တံဆိပ်တပ်ရန် အကြံပြုထားသည်။

အောက်ပါ အဆင့်ဆင့် ဥပမာသည် ပေးထားသော ဒေတာအစုံအတွက် ပြုပြင်ထားသော z-ရမှတ်များကို တွက်ချက်နည်းကို ပြသထားသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

ကျွန်ုပ်တို့တွင် တန်ဖိုး 16 ခုရှိသည့် အောက်ပါဒေတာအတွဲရှိသည်ဆိုပါစို့။

အဆင့် 2- အလယ်အလတ်ကို ရှာပါ။

ထို့နောက် အလယ်အလတ်ကို ရှာပါမည်။ ၎င်းသည် ဒေတာအတွဲ၏ အလယ်ဗဟိုကို ကိုယ်စားပြုသည်၊၊ 16 ဟု ထွက်လာသည်။

အဆင့် 3- တန်ဖိုးတစ်ခုစီနှင့် ပျမ်းမျှကြားရှိ ပကတိကွာခြားချက်ကို ရှာပါ။

ထို့နောက်၊ တစ်ခုချင်းစီဒေတာတန်ဖိုးနှင့် ပျမ်းမျှအကြား ပကတိကွာခြားချက်ကို ကျွန်ုပ်တို့ တွေ့ရှိပါမည်။ ဥပမာအားဖြင့်၊ ပထမဒေတာတန်ဖိုးနှင့် ပျမ်းမျှကြားရှိ ပကတိကွာခြားချက်ကို အောက်ပါအတိုင်း တွက်ချက်သည်-

အကြွင်းမဲ့ ခြားနားချက် = |6 – 16| = ၁၀

ဒေတာတန်ဖိုးတစ်ခုစီနှင့် အလယ်အလတ်ကြားရှိ ပကတိကွာခြားချက်ကို တွက်ချက်ရန် တူညီသောဖော်မြူလာကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

အဆင့် 4- အကြွင်းမဲ့အလယ်အလတ် Deviation ကိုရှာပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် အကြွင်းမဲ့ အလယ်အလတ်သွေဖည်မှုကို တွေ့ရှိပါမည်။ ၎င်းသည် ဒုတိယကော်လံ၏ အလယ်အလတ်ဖြစ်ပြီး၊ 8 ဖြစ်ခဲ့သည်။

အဆင့် 5- ဒေတာတန်ဖိုးတစ်ခုစီအတွက် ပြုပြင်ထားသော Z-ရမှတ်ကို ရှာပါ။

နောက်ဆုံးတွင်၊ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ ဒေတာတန်ဖိုးတစ်ခုစီအတွက် မွမ်းမံထားသော z-score ကို တွက်ချက်နိုင်သည်-

မွမ်းမံထားသော z-ရမှတ် = 0.6745 (x i – x̃) / MAD

ဥပမာ၊ ပထမဒေတာတန်ဖိုးအတွက် ပြုပြင်ထားသော z-ရမှတ်ကို အောက်ပါအတိုင်း တွက်ချက်သည်-

မွမ်းမံထားသော z-ရမှတ် = 0.6745*(6-16) / 8 = -0.843

ဒေတာအတွဲရှိ တန်ဖိုးတစ်ခုစီအတွက် ဤဖော်မြူလာကို ကျွန်ုပ်တို့ ပြန်လုပ်နိုင်ပါသည်။

ဒေတာအတွဲတွင် မည်သည့်တန်ဖိုးမျှ မွမ်းမံထားသော z-ရမှတ်သည် -3.5 ထက်နည်းသော သို့မဟုတ် 3.5 ထက် ပိုများသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ ထို့ကြောင့် ကျွန်ုပ်တို့သည် ဤဒေတာအတွဲရှိ မည်သည့်တန်ဖိုးကိုမဆို ဖြစ်နိုင်ချေရှိသော အကွာအဝေးတစ်ခုအဖြစ် တံဆိပ်တပ်ခြင်းမပြုပါ။

အစွန်းအထင်းတွေကို ဘယ်လိုကိုင်တွယ်မလဲ။

သင့်ဒေတာအတွဲတွင် အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်-

  • outlier သည် data entry error ၏ရလဒ်မဟုတ်ကြောင်းသေချာပါစေ။ တစ်ခါတစ်ရံတွင် တစ်ဦးတစ်ယောက်သည် ဒေတာကိုသိမ်းဆည်းစဉ်တွင် မှားယွင်းသောဒေတာတန်ဖိုးကို ရိုးရှင်းစွာထည့်သွင်းပါသည်။ အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ တန်ဖိုးမှန်ကန်ကြောင်းနှင့် ၎င်းသည် အမှားအယွင်းမဟုတ်ကြောင်း ဦးစွာစစ်ဆေးပါ။
  • အကွာအဝေးကို တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ပါ ။ အကြမ်းဖျင်းသည် ဒေတာထည့်သွင်းမှု အမှားတစ်ခု၏ ရလဒ်ဖြစ်လာပါက၊ ဒေတာအစု၏ ပျမ်းမျှ သို့မဟုတ် အလယ်တန်း ကဲ့သို့ တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ရန် သင်ဆုံးဖြတ်နိုင်သည်။
  • အကြမ်းဖျင်းကို ဖယ်ရှားပါ။ တန်ဖိုးသည် အမှန်တကယ် သာလွန်နေပါက၊ ၎င်းသည် သင်၏ အလုံးစုံခွဲခြမ်းစိတ်ဖြာမှုအပေါ် သိသာထင်ရှားသော သက်ရောက်မှုရှိမည်ဆိုပါက ၎င်းကို ဖယ်ရှားရန် သင်ရွေးချယ်နိုင်ပါသည်။ သာဓကတစ်ခုကို သင်ဖယ်ရှားလိုက်သော သင်၏နောက်ဆုံးအစီရင်ခံစာ သို့မဟုတ် ခွဲခြမ်းစိတ်ဖြာမှုတွင် သေချာစွာဖော်ပြပါ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်