Chauvenet စံသတ်မှတ်ချက်- အဓိပ္ပါယ်နှင့် ဥပမာ
Outlier သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် ပုံမှန်မဟုတ်စွာ ဝေးကွာနေသော စူးစမ်းမှု တစ်ခုဖြစ်သည်။ ခွဲခြမ်းစိတ်ဖြာမှု၏ရလဒ်များကို ထိခိုက်စေနိုင်သောကြောင့် အစွန်းထွက်သူများသည် ပြဿနာရှိနိုင်သည်။
ဒေတာအစုတစ်ခုရှိ အစွန်းထွက်များကို ခွဲခြားသတ်မှတ်ရန် နည်းလမ်းတစ်ခုမှာ အောက်ပါလုပ်ငန်းစဉ်ကိုအသုံးပြုသည့် Chauvenet စံသတ်မှတ်ချက်ကို အသုံးပြုခြင်းဖြစ်သည်-
1. ဒေတာအတွဲတွင် x i တန်ဖိုးတစ်ခုစီအတွက်၊ ပျမ်းမျှမှ သွေဖည်မှုကို အောက်ပါအတိုင်း တွက်ချက်ပါ။
သွေဖည်ခြင်း = |x i – x | /s
x သည် နမူနာဆိုလိုဖြစ်ပြီး s သည် နမူနာစံသွေဖည်သည်။
2. တစ်ဦးချင်းစီတန်ဖိုး၏ သွေဖည်မှုများကို အောက်ဖော်ပြပါ Chauvenet သတ်မှတ်ချက်ဇယားရှိ အရေးကြီးသောတန်ဖိုးများနှင့် နှိုင်းယှဉ်ပါ။ ဇယားတွင်တွေ့ရှိရသောသွေဖည်မှုများထက် ပိုကြီးသောဒေတာတန်ဖိုးများအတွက်၊ ဤဒေတာတန်ဖိုးများကို အစွန်းထွက်များအဖြစ် အစီရင်ခံပါ။

Chauvenet စံသတ်မှတ်ချက်- ဥပမာတစ်ခု
ကျွန်ုပ်တို့တွင် အောက်ပါ ဒေတာတန်ဖိုး 15 ခုရှိသည်ဆိုပါစို့။

ဤဒေတာအတွဲအတွက် နမူနာဆိုလိုသည်မှာ x = 17.067 ဖြစ်ပြီး နမူနာစံသွေဖည်မှုသည် s = 10.096 ဖြစ်သည်။ ဒေတာတန်ဖိုးတစ်ခုစီအတွက်၊ ၎င်း၏သွေဖည်မှုကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။
သွေဖည်ခြင်း = |x i – x | /s
ဥပမာအားဖြင့်:
- ပထမဒေတာတန်ဖိုးသည် |4 မှ 17.067| ၏သွေဖည်မှုဖြစ်လိမ့်မည်။ / 10,096 = 1,294 ။
- ပထမဒေတာတန်ဖိုးသည် |6 မှ 17.067| ၏သွေဖည်မှုဖြစ်မည်။ / 10.096 = 1.096 ။
နောက် … ပြီးတော့။
ဒေတာတန်ဖိုးတစ်ခုစီ၏ သွေဖည်မှုကို တွက်ချက်ရန် တူညီသောဖော်မြူလာကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

ထို့နောက် ကျွန်ုပ်တို့သည် Chauvenet စံနှုန်းဇယားကို ကိုးကားပြီး n=15 ၏နမူနာအရွယ်အစားနှင့် သက်ဆိုင်သည့် အရေးကြီးသောတန်ဖိုးသည် 2.128 ဖြစ်ကြောင်း မှတ်သားနိုင်ပါသည်။ ထို့ကြောင့် 2.128 ထက်ကြီးသော သွေဖည်သည့်တန်ဖိုးကို အစွန်းထွက်တစ်ခုဟု ယူဆနိုင်သည်။
တန်ဖိုး 42 သည် 2.128 ထက် ပိုကြီးသော သွေဖည်မှုရှိသည်ကို တွေ့ရပါသည်။

ထို့ကြောင့်၊ တန်ဖိုး 42 သည် ဤဒေတာအတွဲတွင် တစ်ခုတည်းသော အစွန်းထွက်ဖြစ်သည်။
Chauvenet စံနှုန်းကိုအသုံးပြုခြင်းနှင့် ပတ်သက်၍ ကြိုတင်ကာကွယ်မှုများ
Chauvenet စံသတ်မှတ်ချက်သည် ဒေတာအစုတစ်ခုရှိ တန်ဖိုးများကို ပုံမှန်အတိုင်း ဖြန့်ဝေ သည်ဟု ယူဆသည်။ ဤယူဆချက်နှင့် မကိုက်ညီပါက၊ ပြင်ပအရာများကို ခွဲခြားသတ်မှတ်ရန် Chauvenet စံသတ်မှတ်ချက်ကို အသုံးပြုခြင်းသည် အကျုံးဝင်မည်မဟုတ်ပါ။
ဤနည်းလမ်းကို သင်အသုံးပြုပြီး တန်ဖိုးသည် သာလွန်ကြောင်းတွေ့ရှိပါက၊ တန်ဖိုးသည် ဒေတာထည့်သွင်းမှုအမှားတစ်ခု၏ ရလဒ်မဟုတ်ကြောင်း ဦးစွာစစ်ဆေးရပါမည်။ တခါတရံတွင် ဒေတာများကို မှားယွင်းစွာ ထည့်သွင်းမိပါသည်။
တန်ဖိုးသည် အမှန်တကယ် သာလွန်နေပါက၊ ၎င်းသည် သင်၏ အလုံးစုံခွဲခြမ်းစိတ်ဖြာမှုအပေါ် သိသာထင်ရှားသော သက်ရောက်မှုရှိမည်ဆိုပါက ၎င်းကို ဖယ်ရှားရန် သင်ရွေးချယ်နိုင်ပါသည်။ သင့်ရလဒ်များကို အစီရင်ခံရာတွင် အကြမ်းဖျင်းတစ်ခုကို သင်ဖယ်ရှားခဲ့ကြောင်း သေချာစေပါ။
ထို့အပြင်၊ ဤနည်းလမ်းကို ပေးထားသည့်ဒေတာအတွဲတွင် တစ်ကြိမ်သာ အသုံးပြုသင့်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ယခင်နမူနာတွင် အစွန်းထွက်တစ်ခုအဖြစ် တန်ဖိုး 42 ကို ခွဲခြားသတ်မှတ်ပြီး ထိုတန်ဖိုးကို ဒေတာအတွဲမှ ဖယ်ရှားမည်ဆိုပါစို့။
ထို့နောက် ကျွန်ုပ်တို့သည် နမူနာဆိုလိုရင်း နှင့် နမူနာစံသွေဖည်မှုကို ပြန်လည်မတွက်သင့်ဘဲ အပိုအစွန်းများကိုရှာဖွေရန်အတွက် သွေဖည်မှုများကို ထပ်မံတွက်ချက်သင့်သည်။