Google sheets တွင် outliers များကို အလွယ်တကူ ရှာနည်း


Outlier သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် ပုံမှန်မဟုတ်စွာ ဝေးကွာနေသော စူးစမ်းမှုတစ်ခုဖြစ်သည်။

တတိယ quartile ထက် 1.5 ဆ သို့မဟုတ် ပထမ quartile အောက်ရှိ interquartile အပိုင်းအခြား 1.5 ဆ သို့မဟုတ် interquartile အကွာအဝေးထက် 1.5 ဆ ဖြစ်ပါက ရှုမြင်မှုအား အကြမ်းဖျင်းအဖြစ် သတ်မှတ်ပါသည်။

မှတ်ချက်- interquartile အပိုင်းအခြားသည် ဒေတာအစုတစ်ခု၏ တတိယမြောက် quartile (75th percentile) နှင့် ပထမ quartile (25th percentile) အကြား ကွာခြားချက်ဖြစ်သည်။ ၎င်းသည် ပျမ်းမျှတန်ဖိုးများ၏ 50% ခွဲဝေမှုကို တိုင်းတာသည်။

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် Google Sheets ရှိ ဒေတာအစုံအလင်ရှိ အစွန်းထွက်များကို ရှာဖွေရန် ဤဖော်မြူလာကို အသုံးပြုနည်းကို ပြသထားသည်။

အဆင့် 1: ဒေတာကိုထည့်ပါ။

ပထမဦးစွာ၊ အောက်ပါဒေတာအစုံမှတန်ဖိုးများကို Google Sheets သို့ထည့်ကြပါစို့။

အဆင့် 2- ကွာတားအကွာအဝေးကို တွက်ချက်ပါ။

ထို့နောက်၊ dataset ၏ ပထမ quartile၊ တတိယ quartile နှင့် interquartile range ကို တွက်ချက်ကြည့်ရအောင်။

အဆင့် 3- Outliers ကိုခွဲခြားသတ်မှတ်ပါ။

ထို့နောက် ဒေတာအတွဲရှိ မည်သည့်အစွန်းထွက်များကိုမဆို “ 1” ကို သတ်မှတ်ရန် အောက်ပါဖော်မြူလာကို အသုံးပြုနိုင်ပါသည်။

 = IF ( A2 < $B$18 - $B$20 * 1.5 , 1 , IF ( A2 > $B$19 + $B$20 * 1.5 , 1 , 0 ) )

ဤဖော်မြူလာသည် လေ့လာဆန်းစစ်မှုတစ်ခုသည် တတိယ quartile ထက် 1.5 ဆ သို့မဟုတ် ပထမ quartile အောက်ရှိ interquartile အပိုင်းအခြား 1.5 ဆ ရှိမရှိ စစ်ဆေးပါသည်။

နှစ်ခုလုံးမှန်ပါက၊ ရှုမြင်ချက်ကို အကြမ်းဖျင်းအဖြစ် သတ်မှတ်ရန် “ 1” ကို သတ်မှတ်ပေးသည်။

အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် ဤဖော်မြူလာကို လက်တွေ့တွင် အသုံးပြုနည်းကို ပြသသည်-

Google Sheets တွင် အကြမ်းဖျင်းများကို ရှာပါ။

ကျွန်ုပ်တို့၏ဒေတာအတွဲတွင် တန်ဖိုးတစ်ခုသာ သာလွန်သည်- 164 ဖြစ်သွားသည်ကို ကျွန်ုပ်တို့မြင်သည်။

အစွန်းအထင်းတွေကို ဘယ်လိုကိုင်တွယ်မလဲ။

သင့်ဒေတာတွင် အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်-

1. outlier သည် data entry error ၏ရလဒ်မဟုတ်ကြောင်းသေချာပါစေ။

တစ်ခါတစ်ရံ ရိုးရှင်းသောဒေတာကို မှားယွင်းစွာသိမ်းဆည်းသည်။ အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ တန်ဖိုးမှန်ကန်ကြောင်းနှင့် ၎င်းသည် အမှားအယွင်းမဟုတ်ကြောင်း ဦးစွာစစ်ဆေးပါ။

2. အကွာအဝေးကို တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ပါ

အကြမ်းဖျင်းသည် ဒေတာထည့်သွင်းမှု အမှားတစ်ခု၏ ရလဒ်ဖြစ်ပါက၊ ၎င်းကို ဒေတာအစု၏ ပျမ်းမျှ သို့မဟုတ် အလယ်တန်းကဲ့သို့ တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ရန် သင်ဆုံးဖြတ်နိုင်ပါသည်။

3. အကွာအဝေးကို ဖယ်ရှားပါ။

တန်ဖိုးသည် အမှန်တကယ် သာလွန်ပါက၊ ၎င်းသည် သင်၏ အလုံးစုံခွဲခြမ်းစိတ်ဖြာမှုအပေါ် သိသာထင်ရှားသော သက်ရောက်မှုရှိမည်ဆိုပါက ၎င်းကို ဖယ်ရှားရန် သင်ရွေးချယ်နိုင်ပါသည်။ အကြမ်းဖျင်းကို ဖယ်ရှားကြောင်း သင်၏နောက်ဆုံးအစီရင်ခံစာတွင် သေချာစွာဖော်ပြထားပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အခြားစာရင်းအင်းဆော့ဖ်ဝဲလ်ရှိ အစွန်းထွက်များကို ဖယ်ရှားနည်းကို ရှင်းပြသည်-

R တွင် outliers ကိုမည်သို့ဖယ်ရှားရမည်နည်း
Python ရှိ Outliers များကို မည်ကဲ့သို့ ဖယ်ရှားနည်း
SPSS တွင် outliers ကိုမည်သို့ဖယ်ရှားမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်