Spss တွင် အစွန်းအထင်းများကို မည်သို့ခွဲခြားနိုင်မည်နည်း။
Outlier သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် ပုံမှန်မဟုတ်စွာ ဝေးကွာနေသော စူးစမ်းမှုတစ်ခုဖြစ်သည်။ ခွဲခြမ်းစိတ်ဖြာမှု၏ရလဒ်များကို ထိခိုက်စေနိုင်သောကြောင့် အစွန်းထွက်သူများသည် ပြဿနာရှိနိုင်သည်။
ဤသင်ခန်းစာသည် SPSS ရှိ အစွန်းအထင်းများကို ခွဲခြားသတ်မှတ်ပြီး ကိုင်တွယ်နည်းကို ရှင်းပြထားသည်။
SPSS တွင် outliers ကိုမည်သို့ခွဲခြားနိုင်မည်နည်း။
ကျွန်ုပ်တို့တွင် လူ ၁၅ ဦး၏ နှစ်စဉ်၀င်ငွေ (ထောင်ပေါင်းများစွာ) ကိုပြသသည့် အောက်ပါဒေတာအတွဲရှိသည်ဆိုပါစို့။
outliers များရှိနေခြင်းရှိမရှိ ဆုံးဖြတ်ရန်နည်းလမ်းတစ်ခုမှာ data set အတွက် boxplot တစ်ခုကိုဖန်တီးရန်ဖြစ်သည်။ ၎င်းကိုလုပ်ဆောင်ရန်၊ ခွဲခြမ်းစိတ်ဖြာခြင်း tab ကိုနှိပ်ပါ၊ ထို့နောက် ဖော်ပြချက်စာရင်းအင်းများ ၊ ထို့နောက် စူးစမ်းလေ့လာရန် –
ပေါ်လာသည့်ဝင်းဒိုးအသစ်တွင်၊ မှီခိုသူများစာရင်းဟု အညွှန်းတပ်ထားသော အကွက်ထဲသို့ ပြောင်းနိုင်သော ဝင်ငွေ ကို ဆွဲယူပါ။ ထို့နောက် Statistics ကို နှိပ်ပြီး Percentiles ဘေးရှိ အကွက်ကို အမှန်ခြစ်ပေးကြောင်း သေချာပါစေ။ ထို့နောက် Continue ကိုနှိပ်ပါ။ ထို့နောက် OK ကိုနှိပ်ပါ။
OK ကိုနှိပ်လိုက်သည်နှင့် boxplot တစ်ခုပေါ်လာပါမည်။
အကွက်ကွက်၏ အဆုံးတွင် စက်ဝိုင်း သို့မဟုတ် ကြယ်ပွင့်များ မရှိပါက၊ ၎င်းသည် အစွန်းကွက်များ မရှိသည်ကို ညွှန်ပြသည်။
SPSS သည် အောက်ဖော်ပြပါ အပိုင်းအခြားများ ပြင်ပတွင် ကျရောက်ပါက မည်သည့်ဒေတာတန်ဖိုးကိုမဆို သာလွန်သည်ဟု မှတ်ယူသည်-
- 3rd quartile + 1.5* interquartile အပိုင်းအခြား
- 1st quartile – 1.5* interquartile အပိုင်းအခြား
Tukey Hinges ဟုအမည်တပ်ထားသောအတန်းရှိ 75th နှင့် 25th ရာခိုင်နှုန်းကြားခြားနားချက်ကို ရယူခြင်းဖြင့် ကွာတားအကွာအဝေးကို တွက်ချက်နိုင်သည်-
ဤဒေတာအတွဲအတွက်၊ ကြားကွာတားအကွာအဝေးသည် 82 – 36 = 46 ဖြစ်သည်။ ထို့ကြောင့် အောက်ဖော်ပြပါ အပိုင်းအခြားများ ပြင်ပရှိ မည်သည့်တန်ဖိုးများကိုမဆို အစွန်းထွက်များအဖြစ် သတ်မှတ်လိမ့်မည်-
- 82 + 1.5*46 = 151
- ၃၆ – ၁.၅*၄၆ = -၃၃
သိသာထင်ရှားသည်၊ ဝင်ငွေသည် အနုတ်လက္ခဏာမဖြစ်နိုင်သောကြောင့် ဤဥပမာရှိ အောက်ခြေဘောင်သည် အသုံးမဝင်ပေ။ သို့သော် 151 နှင့်အထက် မည်သည့်ဝင်ငွေကိုမဆို သာလွန်သည်ဟု ယူဆလိမ့်မည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့၏ဒေတာအတွဲတွင် အကြီးဆုံးတန်ဖိုးမှာ 152 အစား 152 ဖြစ်သည်။ ဤဒေတာအတွဲအတွက် အကွက်ကွက်ကွက်မှာ အောက်ပါအတိုင်းဖြစ်သည်-
စက်ဝိုင်းသည် ဒေတာထဲတွင် သာလွန်တစ်ခု ရှိနေကြောင်း ညွှန်ပြသည်။ နံပါတ် 15 သည် ဒေတာအတွဲတွင် မည်သည့်အရာက အစွန်းထွက်သည်ကို ဖော်ပြသည်။
SPSS သည် အောက်ဖော်ပြပါ အပိုင်းအခြားများမှ ပြင်ပသို့ ကျရောက်ပါက မည်သည့်ဒေတာတန်ဖိုးကိုမဆို လွန်ကဲစွာ သာလွန် သည်ဟု မှတ်ယူသည်-
- 3rd quartile + 3* interquartile အပိုင်းအခြား
- 1st quartile – 3* interquartile အပိုင်းအခြား
ထို့ကြောင့် အောက်ဖော်ပြပါ အပိုင်းအခြားများ ပြင်ပရှိ တန်ဖိုးများကို ဤဥပမာတွင် လွန်ကဲသော အစွန်းအထင်းများအဖြစ် သတ်မှတ်သည်-
- ၈၂ + ၃*၄၆ = ၂၂၀
- ၃၆ – ၃*၄၆ = -၁၀၂
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့၏ဒေတာအတွဲတွင် အကြီးဆုံးတန်ဖိုးသည် 221 ဟု ဆိုပါစို့။ ဤဒေတာအတွဲ၏ အကွက်ကွက်ကွက်မှာ ဤအရာဖြစ်သည်-
ခရေပွင့် (*) သည် ဒေတာတွင် လွန်ကဲသော အစွန်းထွက်တစ်ခု ရှိနေကြောင်း ညွှန်ပြသည်။ နံပါတ် 15 သည် ဒေတာအတွဲတွင် မည်သည့်အရာက စောင့်ကြည့်လေ့လာသည်ဖြစ်စေ လွန်ကဲသောအစွန်းထွက်မှုကို ဖော်ပြသည်။
အစွန်းအထင်းတွေကို ဘယ်လိုကိုင်တွယ်မလဲ။
သင့်ဒေတာတွင် အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ သင့်တွင် ရွေးချယ်စရာများစွာရှိသည်-
1. outlier သည် data entry error ၏ရလဒ်မဟုတ်ကြောင်းသေချာပါစေ။
တစ်ခါတစ်ရံတွင် တစ်ဦးတစ်ယောက်သည် ဒေတာကိုသိမ်းဆည်းစဉ်တွင် မှားယွင်းသောဒေတာတန်ဖိုးကို ရိုးရှင်းစွာထည့်သွင်းပါသည်။ အကြမ်းဖျင်းတစ်ခုရှိနေပါက၊ တန်ဖိုးမှန်ကန်ကြောင်းနှင့် ၎င်းသည် အမှားအယွင်းမဟုတ်ကြောင်း ဦးစွာစစ်ဆေးပါ။
2. အကွာအဝေးကို ဖယ်ရှားပါ။
တန်ဖိုးသည် အမှန်တကယ် သာလွန်နေပါက၊ ၎င်းသည် သင်၏ အလုံးစုံခွဲခြမ်းစိတ်ဖြာမှုအပေါ် သိသာထင်ရှားသော သက်ရောက်မှုရှိမည်ဆိုပါက ၎င်းကို ဖယ်ရှားရန် သင်ရွေးချယ်နိုင်ပါသည်။ သာဓကတစ်ခုကို သင်ဖယ်ရှားလိုက်သော သင်၏နောက်ဆုံးအစီရင်ခံစာ သို့မဟုတ် ခွဲခြမ်းစိတ်ဖြာမှုတွင် သေချာစွာဖော်ပြပါ။
3. အကွာအဝေးကို တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ပါ ။
အကြမ်းဖျင်းသည် ဒေတာထည့်သွင်းမှု အမှားတစ်ခု၏ ရလဒ်ဖြစ်လာပါက၊ ဒေတာအစု၏ ပျမ်းမျှ သို့မဟုတ် အလယ်တန်း ကဲ့သို့ တန်ဖိုးအသစ်တစ်ခု သတ်မှတ်ရန် သင်ဆုံးဖြတ်နိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
သင်သည် ကိန်းရှင်များစွာကို တစ်ပြိုင်နက်တည်း လုပ်ဆောင်နေပါက၊ အစွန်းထွက်များကို ရှာဖွေရန် Mahalanobis အကွာအဝေးကို အသုံးပြုလိုပေမည်။