အကြမ်းဖျင်းအားဖြင့် ဆိုလိုခြင်းအပေါ် မည်သို့အကျိုးသက်ရောက်သနည်း။
စာရင်းဇယားများတွင် ဒေတာအစုတစ်ခု၏ ပျမ်းမျှ သည် ပျမ်းမျှတန်ဖိုးဖြစ်သည်။ ဒေတာအတွဲ၏ “ ဗဟို” သည် မည်သည့်နေရာတွင်ရှိသည်ကို အကြံဥာဏ်ပေးသောကြောင့် ၎င်းသည် ကျွန်ုပ်တို့အား သိရှိရန် အသုံးဝင်ပါသည်။ ၎င်းကို ရိုးရှင်းသော ဖော်မြူလာဖြင့် တွက်ချက်သည်-
ပျမ်းမျှ = (လေ့လာချက်ပေါင်းလဒ်) / (လေ့လာတွေ့ရှိချက်အရေအတွက်)
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။
[၁၊ ၄၊ ၅၊ ၆၊ ၇]
ဒေတာအတွဲ၏ ပျမ်းမျှသည် (1+4+5+6+7) / (5) = 4.6 ဖြစ်သည်။
သို့သော် ပျမ်းမျှသည် အသုံးဝင်ပြီး တွက်ချက်ရလွယ်ကူသော်လည်း ၎င်းတွင် အားနည်းချက်တစ်ခုရှိသည်- ၎င်းသည် အစွန်းထွက်မှုများကြောင့် ထိခိုက်နိုင်သည် ။ အထူးသဖြင့်၊ ဒေတာအတွဲသေးငယ်လေ၊ အကြမ်းဖျင်းတစ်ခုက ဆိုလိုရင်းအပေါ် သက်ရောက်မှုပိုများလေဖြစ်သည်။
ယင်းကို သရုပ်ဖော်ရန်၊ အောက်ပါ ဂန္ထဝင် ဥပမာကို သုံးသပ်ကြည့်ပါ-
ဘားတစ်ခုတွင် လူဆယ်ယောက် ထိုင်နေကြသည်။ အမျိုးသားဆယ်ဦး၏ ပျမ်းမျှဝင်ငွေမှာ ဒေါ်လာ ၅၀,၀၀၀ ဖြစ်သည်။ ရုတ်တရက် လူတစ်ယောက်ထွက်လာပြီး Bill Gates ဝင်လာသည်။ ယနေ့ ဘားရှိ အမျိုးသားဆယ်ဦး၏ ပျမ်းမျှဝင်ငွေသည် ဒေါ်လာ သန်း ၄၀ ဖြစ်သည်။
ဤဥပမာသည် သာလွန်သူ (ဘီလ်ဂိတ်) သည် ပျမ်းမျှအား မည်ကဲ့သို့ သိသိသာသာ သက်ရောက်မှုရှိနိုင်သည်ကို ပြသသည်။
သေးငယ်ပြီး ကြီးမားသော အကွက်များ
ပုံမှန်မဟုတ်သော သေးငယ်သော သို့မဟုတ် ပုံမှန်မဟုတ်သော ကြီးမားခြင်းကြောင့် သာလွန်သည် အဓိပ္ပါယ်ကို ထိခိုက်စေနိုင်သည်။ ယခင်ဥပမာတွင်၊ Bill Gates သည် ပုံမှန်မဟုတ်သော ၀င်ငွေမြင့်မားခဲ့ပြီး ပျမ်းမျှအားဖြင့် အထင်မှားစေခဲ့သည်။
သို့သော်လည်း ပုံမှန်မဟုတ်သောနိမ့်သောတန်ဖိုးသည် ပျမ်းမျှအား သက်ရောက်မှုရှိနိုင်သည်။ ယင်းကို သရုပ်ဖော်ရန် အောက်ပါ ဥပမာကို သုံးသပ်ကြည့်ပါ။
ကျောင်းသား ဆယ်ယောက် စာမေးပွဲဖြေပြီး အောက်ဖော်ပြပါ အဆင့်များကို ရယူပါ။
[၀၊ ၈၈၊ ၉၀၊ ၉၂၊ ၉၄၊ ၉၅၊ ၉၅၊ ၉၆၊ ၉၇၊ ၉၉]
ပျမ်းမျှရမှတ်က 84.6 ဖြစ်ပါတယ်။
သို့သော်၊ ကျွန်ုပ်တို့သည် ဒေတာအတွဲမှရမှတ် “0” ကို ဖယ်ရှားပါက၊ ပျမ်းမျှရမှတ်သည် 94 ဖြစ်လာသည်။
ကျောင်းသားတစ်ဦး၏ ပုံမှန်မဟုတ်သော ရမှတ်သည် ဒေတာအစုတစ်ခုလုံး၏ ပျမ်းမျှအား လျော့နည်းစေသည်။
နမူနာအရွယ်အစားနှင့် အစွန်းထွက်များ
ဒေတာအစု၏နမူနာအရွယ်အစား သေးငယ်လေ၊ အကြမ်းဖျင်းအားဖြင့် ဆိုလိုရင်းအပေါ် သက်ရောက်မှု ပိုများလေဖြစ်သည်။
ဥပမာအားဖြင့်၊ သုညရမှတ်ရရှိသော ကျောင်းသားတစ်ဦးမှလွဲ၍ ကျောင်းသားအားလုံး အနည်းဆုံး 90 သို့မဟုတ် အထက်ရမှတ် 100 ၏ဒေတာအတွဲတစ်ခုရှိသည်ဆိုပါစို့။
[ 0 ၊ 90 ၊ 90 ၊ 92 ၊ 94 ၊ 95 ၊ 95 ၊ 96 ၊ 97 ၊ 99 ၊ 94 ၊ 90 ၊ 90 ၊ 92 ၊ 94 ၊ 95 ၊ 95 ၊ 96 ၊ 97 ၊ 99 ၊ 93 ၊ 90 ၊ 90 ၊ 92၊ ၊ ၉၅၊ ၉၅၊ ၉၆၊ ၉၇၊ ၉၉၊ ၉၃၊ ၉၀၊ ၉၀၊ ၉၂၊ ၉၄၊ ၉၅၊ ၉၅၊ ၉၆၊ ၉၇၊ ၉၉၊ ၉၃၊ ၉၀၊ ၉၀၊ ၉၂၊ ၉၄၊ ၉၅၊ ၉၆၊ ၉၊ ၉၊ 93, 90, 90, 92, 94, 95, 95, 96, 97, 99, 93, 90, 90, 92, 94, 95, 95, 96, 97, 99, 93, 90, 90, 92၊ ၊ ၉၅၊ ၉၅၊ ၉၆၊ ၉၇၊ ၉၉၊ ၉၃၊ ၉၀၊ ၉၀၊ ၉၂၊ ၉၄၊ ၉၅၊ ၉၅၊ ၉၆၊ ၉၇၊ ၉၉၊ ၉၃၊ ၉၀၊ ၉၀၊ ၉၂၊ ၉၄၊ ၉၅၊ ၉၆၊ ၉၊ ၉၊ ]
ပျမ်းမျှ 93.18 ဖြစ်လာသည်။ ဒေတာအတွဲမှ “0” ကို ဖယ်ရှားပါက ပျမ်းမျှ 94.12 ဖြစ်ပါမည်။ ဒါက အတော်လေးသေးငယ်တဲ့ ခြားနားချက်ပါ။ ဒေတာအစုံသည် အလုံအလောက်ကြီးနေပါက လွန်ကဲလွန်ကဲသည့်အရာတစ်ခုပင်လျှင် အနည်းငယ်မျှသာအကျိုးသက်ရောက်မှုရှိသည်ကို ပြသသည်။
အစွန်းအထင်းတွေကို ဘယ်လိုကိုင်တွယ်မလဲ။
သင့်ဒေတာအတွဲတွင် အစွန်းထွက်မှုတစ်ခုရှိမည်ကို စိုးရိမ်ပါက၊ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်-
- outlier သည် data entry error ၏ရလဒ်မဟုတ်ကြောင်းသေချာပါစေ။ တစ်ခါတစ်ရံတွင် တစ်ဦးတစ်ယောက်သည် ဒေတာကိုသိမ်းဆည်းစဉ်တွင် မှားယွင်းသောဒေတာတန်ဖိုးကို ရိုးရှင်းစွာထည့်သွင်းပါသည်။ အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ တန်ဖိုးမှန်ကန်ကြောင်းနှင့် ၎င်းသည် အမှားအယွင်းမဟုတ်ကြောင်း ဦးစွာစစ်ဆေးပါ။
- အကွာအဝေးကို တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ပါ ။ အကြမ်းဖျင်းသည် ဒေတာထည့်သွင်းမှု အမှားတစ်ခု၏ ရလဒ်ဖြစ်လာပါက၊ ဒေတာအစု၏ ပျမ်းမျှ သို့မဟုတ် အလယ်တန်း ကဲ့သို့ တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ရန် သင်ဆုံးဖြတ်နိုင်သည် ။
- အကြမ်းဖျင်းကို ဖယ်ရှားပါ။ တန်ဖိုးသည် အမှန်တကယ် သာလွန်နေပါက၊ ၎င်းသည် သင်၏ အလုံးစုံခွဲခြမ်းစိတ်ဖြာမှုအပေါ် သိသာထင်ရှားသော သက်ရောက်မှုရှိမည်ဆိုပါက ၎င်းကို ဖယ်ရှားရန် သင်ရွေးချယ်နိုင်ပါသည်။ သာဓကတစ်ခုကို သင်ဖယ်ရှားလိုက်သော သင်၏နောက်ဆုံးအစီရင်ခံစာ သို့မဟုတ် ခွဲခြမ်းစိတ်ဖြာမှုတွင် သေချာစွာဖော်ပြပါ။
အလယ်အလတ်ကိုသုံးပါ။
ဒေတာအစုတစ်ခု၏ “ ဗဟို” ကိုရှာဖွေရန် အခြားသောနည်းလမ်းမှာ အသေးဆုံးမှ အကြီးဆုံးမှ အကြီးဆုံးအထိ ဒေတာသတ်မှတ်ထားသော ဒေတာတစ်ခုစီတွင် တစ်ခုချင်းစီတန်ဖိုးများအားလုံးကို အမိန့်ပေးခြင်းဖြင့် ရရှိသော ပျမ်းမျှတန်ဖိုးကို အသုံးပြုပြီး ပျမ်းမျှတန်ဖိုးကို ရှာဖွေခြင်းဖြစ်သည်။
၎င်းကို တွက်ချက်နည်းကြောင့်၊ အလယ်အလတ်သည် အစွန်းထွက်မှုများကြောင့် ထိခိုက်မှုနည်းပြီး အစွန်းထွက်များရှိပါက ဖြန့်ဖြူးမှု၏ဗဟိုတည်နေရာကို ပိုမိုကောင်းမွန်စွာ ဖမ်းယူနိုင်သည်။
ဥပမာ၊ ရပ်ကွက်တစ်ခုရှိ အိမ်များ၏ စတုရန်းပုံများကို ပြသသည့် အောက်ပါဂရပ်ကို သုံးသပ်ကြည့်ပါ-
ပျမ်းမျှအား အလယ်အလတ်မရှိသော်လည်း အလွန်ကြီးမားသောအိမ်အနည်းငယ်မှ ကြီးကြီးမားမားလွှမ်းမိုးထားသည်။ ထို့ကြောင့်၊ အလယ်အလတ်သည် ပျမ်းမျှထက် ထိုရပ်ကွက်ရှိ အိမ်တစ်အိမ်၏ “ ပုံမှန်” စတုရန်းပုံများကို ရိုက်ကူးရန် ပိုမိုကောင်းမွန်သောအလုပ်ဖြစ်သည်။
နောက်ထပ်ဖတ်ရန်:
ဗဟိုသဘောထားတိုင်းတာချက်များ – ပျမ်းမျှ၊ အလယ်အလတ်နှင့် မုဒ်
အစွန်းအထင်းများကို သိရှိရန် Dixon ၏ Q စမ်းသပ်မှု
Outlier Calculator