ကွာတားအကွာအဝေးနှင့် စံသွေဖည်မှု- ကွာခြားချက်ကား အဘယ်နည်း။
interquartile range နှင့် standard deviation သည် data set တစ်ခုတွင် တန်ဖိုးများ ဖြန့်ဖြူးမှုကို တိုင်းတာရန် နည်းလမ်းနှစ်ခုဖြစ်သည်။
ဤသင်ခန်းစာသည် မက်ထရစ်တစ်ခုစီ၏ အတိုချုံးရှင်းလင်းချက်နှစ်ခုကြားရှိ တူညီမှုများနှင့် ကွာခြားချက်များကို ပေးပါသည်။
Interquartile အပိုင်းအခြား
ဒေတာအတွဲတစ်ခု၏ ကြားပိုင်းအကွာအဝေး (IQR) သည် ပထမ quartile (25th percentile) နှင့် တတိယ quartile (the 75th percentile) အကြား ကွာခြားချက်ဖြစ်သည်။ ၎င်းသည် ပျမ်းမျှတန်ဖိုးများ၏ 50% ခွဲဝေမှုကို တိုင်းတာသည်။
IQR = Q3 – Q1
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။
ဒေတာအတွဲ- ၁၊ ၄၊ ၈၊ ၁၁၊ ၁၃၊ ၁၇၊ ၁၉၊ ၁၉၊ ၂၀၊ ၂၃၊ ၂၄၊ ၂၄၊ ၂၅၊ ၂၈၊ ၂၉၊ ၃၁၊ ၃၂
interquartile range ဂဏန်းတွက်စက်အရ၊ ဤဒေတာအတွဲအတွက် interquartile range (IQR) ကို အောက်ပါအတိုင်း တွက်ချက်သည်-
- T1: 12
- T3: 26.5
- IQR = Q3 – Q1 = 14.5
၎င်းသည် ဒေတာအတွဲရှိ တန်ဖိုးများ၏ 50% အလယ်တွင် 14.5 နှင့် သွေဖည်နေကြောင်း ကျွန်ုပ်တို့ကို ပြောပြသည်။
စံသွေဖည်
ဒေတာအစုတစ်ခု၏ စံသွေဖည်မှုသည် ပျမ်းမျှတန်ဖိုးမှ တစ်ဦးချင်းတန်ဖိုးများ၏ ပုံမှန်သွေဖည်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။ အောက်ပါအတိုင်း တွက်ချက်သည်။
s = √(Σ(x i – x ) 2 / (n-1))
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။
ဒေတာအတွဲ- ၁၊ ၄၊ ၈၊ ၁၁၊ ၁၃၊ ၁၇၊ ၁၉၊ ၁၉၊ ၂၀၊ ၂၃၊ ၂၄၊ ၂၄၊ ၂၅၊ ၂၈၊ ၂၉၊ ၃၁၊ ၃၂
ဤဒေတာအတွဲ၏ စံသွေဖည်မှုမှာ 9.25 ဖြစ်ကြောင်း ရှာဖွေရန် ဂဏန်းပေါင်းစက်ကို အသုံးပြုနိုင်သည်။ ၎င်းသည် ကျွန်ုပ်တို့အား ပုံမှန်တန်ဖိုးသည် ပျမ်းမျှထံမှ မည်မျှအကွာအဝေးရှိသည်ကို အကြံဥာဏ်ပေးသည်။
တူညီမှုများနှင့် ကွဲပြားမှုများ
ကွာတားအကွာအဝေးနှင့် စံသွေဖည်မှုတို့သည် အောက်ဖော်ပြပါ ဆင်တူယိုးမှားကို မျှဝေပါသည်။
- မက်ထရစ်နှစ်ခုလုံးသည် ဒေတာအစုတစ်ခုတွင် တန်ဖိုးများဖြန့်ဖြူးမှုကို တိုင်းတာသည်။
သို့သော်၊ ကြားကွာတားအကွာအဝေးနှင့် စံသွေဖည်မှုတွင် အောက်ပါအဓိကကွာခြားချက်ရှိသည်။
- interquartile အကွာအဝေး (IQR) သည် လွန်ကဲသော အကွာအဝေးများကြောင့် သက်ရောက်မှုမရှိပါ။ ဥပမာအားဖြင့်၊ ဒေတာအတွဲတစ်ခုရှိ အလွန်သေးငယ်သော သို့မဟုတ် အလွန်ကြီးမားသောတန်ဖိုးသည် IQR တွက်ချက်မှုကို အကျိုးသက်ရောက်မည်မဟုတ်သောကြောင့် IQR သည် ဒေတာအတွဲ၏ 25th ရာခိုင်နှုန်းနှင့် 75th ရာခိုင်နှုန်းတန်ဖိုးများကိုသာ အသုံးပြုသောကြောင့်ဖြစ်သည်။
- စံသွေဖည်မှုသည် လွန်ကဲသော လွန်ကဲမှုများကြောင့် ထိခိုက် သည် ။ ဥပမာအားဖြင့်၊ ဒေတာအတွဲတစ်ခုရှိ အလွန်ကြီးမားသောတန်ဖိုးသည် စံသွေဖည်မှုတွင် ၎င်း၏ဖော်မြူလာရှိ ဒေတာအစုံရှိတန်ဖိုးတိုင်းကို အသုံးပြုသောကြောင့် စံသွေဖည်မှု ပိုမိုကြီးမားလာမည်ဖြစ်သည်။
တစ်ခုချင်းစီကို ဘယ်အချိန်မှာ သုံးမလဲ။
လွန်ကဲလွန်ကဲသော အစွန်းအထင်းများရှိနေသောအခါ ဒေတာအတွဲတစ်ခုတွင် တန်ဖိုးများဖြန့်ဝေမှုကို တိုင်းတာရန် interquartile range ကို အသုံးပြုသင့်သည်။
အပြန်အလှန်အားဖြင့်၊ လွန်ကဲလွန်ကဲသောအစွန်းအထင်းများမရှိသည့်အခါ တန်ဖိုးများဖြန့်ဝေမှုကိုတိုင်းတာရန် စံသွေဖည်မှုကို အသုံးပြုသင့်သည်။
အဘယ်ကြောင့်ဆိုသော် ဖော်ပြရန် အောက်ပါဒေတာအတွဲကို သုံးသပ်ကြည့်ပါ-
ဒေတာအတွဲ- ၁၊ ၄၊ ၈၊ ၁၁၊ ၁၃၊ ၁၇၊ ၁၉၊ ၁၉၊ ၂၀၊ ၂၃၊ ၂၄၊ ၂၄၊ ၂၅၊ ၂၈၊ ၂၉၊ ၃၁၊ ၃၂
ဆောင်းပါးအစောပိုင်းတွင်၊ ဤဒေတာအတွဲအတွက် အောက်ပါ မက်ထရစ်များကို ကျွန်ုပ်တို့ တွက်ချက်ခဲ့သည်-
- IQR: 14.5
- စံသွေဖည်: 9.25
သို့သော်၊ ဒေတာအတွဲတွင် လွန်ကဲသော သာလွန်ထူးခြားမှု ရှိ၊ မရှိ သုံးသပ်ပါ။
ဒေတာအတွဲ- ၁၊ ၄၊ ၈၊ ၁၁၊ ၁၃၊ ၁၇၊ ၁၉၊ ၁၉၊ ၂၀၊ ၂၃၊ ၂၄၊ ၂၄၊ ၂၅၊ ၂၈၊ ၂၉၊ ၃၁၊ ၃၂၊ ၃၇၈
ဤဒေတာအတွဲအတွက် အောက်ဖော်ပြပါ မက်ထရစ်များကို ရှာဖွေရန် ဂဏန်းပေါင်းစက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။
- IQR: 15
- စံသွေဖည်: 85.02
စံသွေဖည်မှု 9.25 မှ 85.02 သို့ တိုးလာချိန်တွင် ကွာတားအကွာအဝေးသည် သာလွန်မှုတစ်ခုရှိနေသောအခါတွင် အနည်းငယ်ပြောင်းလဲသွားသည်ကို သတိပြုပါ။
ထပ်လောင်းအရင်းအမြစ်များ
ဗဟိုသဘောထား တိုင်းတာချက်များ- အဓိပ္ပါယ်နှင့် ဥပမာများ
ကွဲလွဲမှုအတိုင်းအတာ- အဓိပ္ပါယ်နှင့် ဥပမာများ
interquartile range ကိုသုံးပြီး outliers ကိုဘယ်လိုရှာမလဲ။