စံသွေဖည်အသုံးပြုခြင်း၏ အားသာချက်များနှင့် အားနည်းချက်များ
ဒေတာအစုတစ်ခု၏ စံသွေဖည်မှုသည် ပျမ်းမျှတန်ဖိုးမှ တစ်ဦးချင်းတန်ဖိုးများ၏ ပုံမှန်သွေဖည်မှုကို တိုင်းတာရန် နည်းလမ်းတစ်ခုဖြစ်သည်။
နမူနာစံသွေဖည်မှုကို တွက်ချက်ရန်အတွက် ဖော်မြူလာ၊ အမှတ်အသားပြုထားသော s သည်-
s = √ Σ(x i – x̄) 2 / (n – 1)
ရွှေ-
- ∑ : “ပေါင်း” ဟူသော သင်္ကေတ၊
- x i : ဒေတာအစုံရှိ i th တန်ဖိုး
- x̄ : နမူနာဆိုလိုသည်။
- n : နမူနာအရွယ်အစား
ဒေတာအတွဲတစ်ခုတွင် တန်ဖိုးများ ဖြန့်ကျက်ဖော်ပြရန် စံသွေဖည်မှုကို အသုံးပြုခြင်းအတွက် အဓိကအားသာချက်နှစ်ခုရှိသည်။
အားသာချက် #1- စံသွေဖည်မှု သည် ၎င်း၏တွက်ချက်မှုတွင် ဒေတာအတွဲတစ်ခုတွင် မှတ်သားမှုများအားလုံးကို အသုံးပြုသည်။ ကိန်းဂဏန်းစာရင်းဇယားများတွင်၊ ကျွန်ုပ်တို့သည် ဒေတာအစုံတွင်ရရှိနိုင်သော ဖြစ်နိုင်သမျှ “ အချက်အလက်” အားလုံးကို အသုံးပြုထားသောကြောင့် တွက်ချက်မှုများလုပ်ဆောင်ရန်အတွက် ဒေတာအတွဲတစ်ခုတွင် လေ့လာတွေ့ရှိချက်အားလုံးကို အသုံးပြုခြင်းသည် ကောင်းမွန်သောအရာဖြစ်သည်ဟု ယေဘူယျအားဖြင့် ကျွန်ုပ်တို့ပြောပါသည်။
အားသာချက် # 2- စံသွေဖည်သည် အဓိပ္ပာယ်ဖွင့်ဆိုရန် လွယ်ကူသည် ။ စံသွေဖည်မှုသည် ဒေတာအတွဲတစ်ခုရှိ “ ပုံမှန်” စူးစမ်းလေ့လာမှုသည် ပျမ်းမျှတန်ဖိုးနှင့် မည်မျှဝေးသည်ဟူသော အကြံဥာဏ်တစ်ခုပေးသည့် တစ်ခုတည်းသောတန်ဖိုးဖြစ်သည်။
သို့သော်၊ စံသွေဖည်မှုကို အသုံးပြုရာတွင် အဓိက အားနည်းချက်တစ်ခုရှိသည်။
အားနည်းချက် # 1- စံသွေဖည်မှုကို အစွန်းအထင်းများကြောင့် ထိခိုက်နိုင်သည် ။ ဒေတာအတွဲတစ်ခုတွင် လွန်ကဲသောအစွန်းအထင်းများရှိနေသောအခါ၊ ၎င်းသည် စံသွေဖည်တန်ဖိုးကို တိုးစေပြီး ဒေတာအစုတစ်ခုအတွင်း တန်ဖိုးများဖြန့်ဝေခြင်းနှင့်ပတ်သက်၍ လွဲမှားသောအယူအဆကို ပေးသည်။
အောက်ဖော်ပြပါ ဥပမာများသည် စံသွေဖည်မှုကို အသုံးပြုခြင်း၏ အားသာချက်များနှင့် အားနည်းချက်များအကြောင်း အချက်အလက်များ ပိုမိုပေးဆောင်ပါသည်။
အားသာချက် #1- စံသွေဖည်မှု သည် စောင့်ကြည့်မှုအားလုံးကို အသုံးပြုသည်။
အတန်းတစ်ခုရှိ ကျောင်းသားများအတွက် စာမေးပွဲရမှတ်များ ခွဲဝေမှုကို ပြသသော အောက်ပါဒေတာအတွဲရှိသည်ဆိုပါစို့။
အဆင့်သတ်မှတ်ချက်များ- 68၊ 70၊ 71၊ 75၊ 78၊ 82၊ 83၊ 83၊ 85၊ 90၊ 91၊ 91၊ 92
ဤဒေတာအတွဲ၏နမူနာစံသွေဖည်မှုမှာ 8.46 ဖြစ်ကြောင်းရှာဖွေရန် ဂဏန်းပေါင်းစက် သို့မဟုတ် ကိန်းဂဏန်းဆော့ဖ်ဝဲကို အသုံးပြုနိုင်သည်။
ဤဥပမာတွင် စံသွေဖည်မှုကို အသုံးပြုခြင်း၏ အားသာချက်မှာ တန်ဖိုးများ၏ ပုံမှန် “ ဖြန့်ဝေမှု” ကိုရှာဖွေရန် ဒေတာအစုံရှိ ဖြစ်နိုင်သော စူးစမ်းမှုများကို ကျွန်ုပ်တို့အသုံးပြုခြင်းဖြစ်ပါသည်။
ဆန့်ကျင်ဘက်အားဖြင့်၊ ဤဒေတာအစုတွင် တန်ဖိုးများ ပျံ့နှံ့မှုကို တိုင်းတာရန် ကျွန်ုပ်တို့သည် အပြန်အလှန် ကွာတားအကွာအဝေးကဲ့သို့သော အခြားမက်ထရစ်ကို အသုံးပြုနိုင်သည်။
interquartile range သည် 17.5 ဖြစ်ကြောင်း ရှာဖွေရန် ဂဏန်းပေါင်းစက်ကို အသုံးပြုနိုင်သည်။ ၎င်းသည် dataset ရှိ တန်ဖိုးများ၏ အလယ် 50% အကြား ကွာဟချက်ကို ကိုယ်စားပြုသည်။
ယခု ကျွန်ုပ်တို့သည် ဒေတာအတွဲရှိ အနိမ့်ဆုံးတန်ဖိုးကို များစွာနိမ့်စေရန် ပြောင်းလဲမည်ဆိုပါစို့။
အဆင့်သတ်မှတ်ချက်များ- 22၊ 70၊ 71၊ 75၊ 78၊ 82၊ 83၊ 83၊ 85၊ 90၊ 91၊ 91၊ 92
နမူနာစံသွေဖည်မှုမှာ 18.37 ဖြစ်ကြောင်း ရှာဖွေရန် ဂဏန်းပေါင်းစက်ကို အသုံးပြုနိုင်သည်။
သို့သော်လည်း interquartile range သည် 17.5 ဖြစ်နေဆဲဖြစ်သော ကြောင့် အလယ်တန်းတန်ဖိုးများ၏ 50% သည် မည်သည့်အရာကိုမျှ မထိခိုက်ပါ။
နမူနာစံသွေဖည်မှုသည် ၎င်း၏တွက်ချက်မှုတွင် ဒေတာအတွဲရှိ မှတ်သားမှုများအားလုံးကို ထည့်သွင်းစဉ်းစားကြောင်းပြသသည်၊ ကွဲလွဲမှု၏အခြားအတိုင်းအတာများနှင့်မတူဘဲ၊
အားသာချက် # 2- စံသွေဖည်မှုကို အဓိပ္ပာယ်ဖွင့်ဆိုရန် လွယ်ကူသည်။
အတန်းတစ်ခုရှိ ကျောင်းသားများအတွက် စာမေးပွဲရမှတ်များ ခွဲဝေမှုကို ပြသသည့် အောက်ပါဒေတာအတွဲကို ပြန်သတိရပါ-
အဆင့်သတ်မှတ်ချက်များ- 68၊ 70၊ 71၊ 75၊ 78၊ 82၊ 83၊ 83၊ 85၊ 90၊ 91၊ 91၊ 92
ဤဒေတာအတွဲ၏နမူနာစံသွေဖည်မှုမှာ 8.46 ဖြစ်ကြောင်းရှာဖွေရန် ဂဏန်းပေါင်းစက်ကိုအသုံးပြုခဲ့သည်။
“ ပုံမှန်” စာမေးပွဲရမှတ်၏ သွေဖည်မှုမှာ ပျမ်းမျှ စာမေးပွဲရမှတ်မှ ခန့်မှန်းခြေ 8.46 ဖြစ်သောကြောင့် အဓိပ္ပာယ်ဖွင့်ဆိုရန် လွယ်ကူပါသည်။
တစ်ဖက်တွင်၊ အခြားသော ပြန့်ကျဲမှုအတိုင်းအတာများသည် အဓိပ္ပာယ်ဖွင့်ဆိုရန် မလွယ်ကူပေ။
ဥပမာအားဖြင့်၊ ကွဲလွဲမှု၏ကိန်းဂဏန်း သည် စံသွေဖည်မှု၏ အချိုးအစားကို ကိုယ်စားပြုသည့် ကွဲလွဲမှု၏ အခြားအတိုင်းအတာတစ်ခုဖြစ်သည်။
ကွဲလွဲမှု၏ကိန်းဂဏန်း- s/x̄
ဤဥပမာတွင်၊ ပျမ်းမျှစာမေးပွဲရမှတ်မှာ 81.46 ဖြစ်ပြီး၊ ကွဲလွဲမှု၏ကိန်းဂဏန်းကို အောက်ပါအတိုင်း တွက်ချက်သည်- 8.46 / 81.46 = 0.104 ဖြစ်သည်။
၎င်းသည် နမူနာစံနှုန်းသွေဖည်ခြင်း၏ အချိုးအစားကို ကိုယ်စားပြုသည်၊ ၎င်းသည် ဒေတာအစုံများစွာကိုဖြတ်၍ တန်ဖိုးများခွဲဝေမှုကို နှိုင်းယှဉ်ရန်အတွက် အသုံးဝင်နိုင်သော်လည်း ၎င်းကိုယ်တိုင်က မက်ထရစ်တစ်ခုအဖြစ် အဓိပ္ပာယ်ပြန်ဆိုရန် အလွန်လွယ်ကူသည်မဟုတ်ပါ။
အားနည်းချက် # 1- စံသွေဖည်မှုကို အစွန်းအထင်းများကြောင့် ထိခိုက်နိုင်သည်။
ကုမ္ပဏီတစ်ခုတွင် ဝန်ထမ်း 10 ဦး (ဒေါ်လာထောင်ပေါင်းများစွာ) အတွက် လစာအချက်အလက်ပါရှိသော အောက်ပါဒေတာအတွဲကို ဆိုပါစို့။
လစာ- 44၊ 48၊ 57၊ 68၊ 70၊ 71၊ 73၊ 79၊ 84၊ 94
လစာ၏နမူနာစံသွေဖည်မှုသည် ခန့်မှန်းခြေအားဖြင့် 15.57 ဖြစ်သည်။
ယခု ကျွန်ုပ်တို့တွင် တူညီသော ဒေတာအစုံရှိသည်ဆိုပါစို့၊ သို့သော် အမြင့်ဆုံးလစာသည် များစွာ မြင့်မားသည်-
လစာ- 44၊ 48၊ 57၊ 68၊ 70၊ 71၊ 73၊ 79၊ 84၊ 895
ဤဒေတာအတွဲရှိ လစာ၏နမူနာစံသွေဖည်မှုသည် ခန့်မှန်းခြေအားဖြင့် 262.47 ဖြစ်သည်။
လွန်ကဲသောအစွန်းထွက်တစ်ခုမျှသာပါဝင်ခြင်းဖြင့်၊ စံသွေဖည်မှုသည် များစွာအကျိုးသက်ရောက်ခဲ့ပြီး ယခုအခါ “ ပုံမှန်” လစာခွဲဝေမှု၏ လွဲမှားသောအတွေးအမြင်ကို ပေးစွမ်းသည်။
မှတ်ချက် – ဒေတာအတွဲတစ်ခုတွင် အစွန်းထွက်များရှိနေသောအခါ၊ ကွာတားအကွာအဝေးသည် ပြင်ပမှသက်ရောက်မှုမရှိသောကြောင့် ပြန့်ကျဲမှုပိုကောင်းသောအတိုင်းအတာကို ပေးစွမ်းနိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် စာရင်းဇယားများတွင် စံသွေဖည်မှုကို အသုံးပြုခြင်းနှင့်ပတ်သက်သော နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
ကွာတားအကွာအဝေးနှင့် စံသွေဖည်မှု- ခြားနားချက်
ကွဲလွဲမှု နှင့် စံသွေဖည်မှု ကိန်းဂဏန်း- ကွာခြားချက်
လူဦးရေ vs. နမူနာစံသွေဖည်မှု- တစ်ခုစီကို ဘယ်အချိန်မှာ အသုံးပြုမလဲ။