Outliers ဖြင့် box plot ကိုမည်သို့ဖတ်နည်း (ဥပမာနှင့်အတူ)
အကွက်ကွက်ကွက် သည် ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို ဖော်ပြသည့် ကွက်ကွက်အမျိုးအစားတစ်ခုဖြစ်ပြီး၊ ၎င်းပါဝင်သည်-
- အနိမ့်ဆုံးတန်ဖိုး
- ပထမ quartile (၂၅ ခုမြောက် ရာခိုင်နှုန်း)
- ပျမ်းမျှတန်ဖိုး
- တတိယ ကွာတား (၇၅ ခုမြောက် ရာခိုင်နှုန်း)၊
- အများဆုံးတန်ဖိုး
အကွက်ကွက်ကွက်တစ်ခုပြုလုပ်ရန် ပထမအကြိမ်မှ တတိယမြောက် လေးပုံးတစ်ကွက်ကို ဦးစွာဆွဲပါ။
ထို့နောက် အလယ်ဗဟိုတွင် ဒေါင်လိုက်မျဉ်းတစ်ခုဆွဲပါ။
နောက်ဆုံးတွင်၊ ကျွန်ုပ်တို့သည် အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးတန်ဖိုးအထိ quartiles များ၏ “ ပါးသိုင်းမွှေးများ” ကို ဆွဲပါသည်။

စာရင်းအင်းဆော့ဖ်ဝဲအများစုတွင်၊ အောက်ပါလိုအပ်ချက်နှစ်ခုအနက်မှတစ်ခုနှင့်ကိုက်ညီပါက စောင့်ကြည့်မှုတစ်ခုကို အကြမ်းဖျင်းအဖြစ် သတ်မှတ်သည်-
- စူးစမ်းလေ့လာမှုသည် ပထမ quartile (Q1) အောက်ရှိ interquartile range ၏ 1.5 ဆ၊
- စူးစမ်းလေ့လာမှုသည် တတိယ quartile (Q3) ထက် ကွာတားအကွာအဝေးထက် 1.5 ဆဖြစ်သည်။
ဒေတာအတွဲတစ်ခုတွင် အစွန်းအထင်းတစ်ခုရှိနေပါက၊ ၎င်းကို အကွက်ကွက်ကွက်ရှိ ပါးသိုင်းမွှေးအကွာအဝေးအပြင်ဘက်တွင် အစက်ငယ်ဖြင့် တံဆိပ်တပ်လေ့ရှိသည်-

ဤသို့ဖြစ်လာသောအခါ၊ boxplot ရှိ “ အနည်းဆုံး” နှင့် “ အမြင့်ဆုံး” တန်ဖိုးများကို Q1 – 1.5*IQR နှင့် Q3 + 1.5*IQR တို့၏တန်ဖိုးများကို အသီးသီးသတ်မှတ်ပေးပါသည်။
အောက်ဖော်ပြပါ ဥပမာသည် အကွက်ကွက်ကွက်များကို အစွန်းအဖျားများဖြင့် အဓိပ္ပါယ်ဖွင့်ဆိုပုံတို့ကို ပြသထားသည်။
ဥပမာ- Outliers ဖြင့် Box Plot ကို ဘာသာပြန်ခြင်း။
မတူညီသောအသင်းနှစ်သင်းမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များခွဲဝေမှုကိုမြင်ယောင်နိုင်ရန် အောက်ပါအကွက်နှစ်ခုကို ဖန်တီးသည်ဆိုပါစို့။

Team A အတွက် ဘယ်ဘက်ကွက်လပ်တွင် အနိမ့်ဆုံး သို့မဟုတ် အများဆုံး ပါးသိုင်းမွှေး၏ အပြင်ဘက်တွင် အစက်ငယ်များ မရှိသောကြောင့် အစွန်းထွက်များ မရှိပါ။
သို့သော်၊ Team B အတွက် ညာဘက်ထောင့်ကွက်တွင် “ အမြင့်ဆုံး” တန်ဖိုးနှင့် “ အနည်းဆုံး” တန်ဖိုးအောက် အစွန်းတစ်ခုရှိသည်။
ဤသည်မှာ Team B အတွက် “ Points” variable ဖြန့်ချီခြင်းအတွက် လက်ရှိဂဏန်းငါးလုံးအကျဉ်းချုပ်ဖြစ်ပါသည်-
- အနိမ့်ဆုံးတန်ဖိုး- 1.1
- ပထမအကြိမ်- ၁၀.၅
- ပျမ်းမျှ- ၁၂.၇
- တတိယအကြိမ်- ၁၅.၆
- အများဆုံးတန်ဖိုး- 23.5
ဤသည်မှာ ဖြစ်နိုင်ချေရှိသော အကွာအဝေးများ၏ ကန့်သတ်ချက်များကို တွက်ချက်နည်းဖြစ်သည်။
Interquartile scale : တတိယ quartile – ပထမ quartile = 15.6 – 10.5 = 5.1
အနိမ့်ဆုံးကန့်သတ်ချက် – Q1 – 1.5*IQR = 10.5 – 1.5*5.1 = 2.85
အထက်ကန့်သတ်ချက် – Q3 + 1.5*IQR = 15.6 + 1.5*5.1 = 23.25
boxplot ရှိ အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးတန်ဖိုးများအတွက် ပါးသိုင်းမွှေးများကို 2.85 နှင့် 23.25 တွင်ထားရှိပါသည်။
ထို့ကြောင့်၊ 1.1 နှင့် 23.5 တန်ဖိုးများရှိသော လေ့လာတွေ့ရှိချက်များသည် ၎င်းတို့သည် အောက်ပိုင်းနှင့် အထက်ဘောင်များအပြင်ဘက်တွင် ကျရောက်သောကြောင့် boxplot တွင် outliers အဖြစ် အရည်အချင်းပြည့်မီပါသည်။
အပိုဆု – ဤသည်မှာ R ပရိုဂရမ်းမင်းဘာသာစကားဖြင့် ဤ boxplots နှစ်ခုကို ဖန်တီးရန် ကျွန်ုပ်တို့အသုံးပြုခဲ့သော ကုဒ်အတိအကျဖြစ်သည်-
library (ggplot2) #make this example reproducible set. seeds (2) #create data frame df <- data. frame (Team = factor(rep(c("A", "B"), each = 200)), Points = c(rnorm(200, mean = 15, sd = 3), rnorm(200, mean = 12, sd = 4))) #create box plots ggplot(df, aes(x = Team, y = Points)) + stat_boxplot(geom = " errorbar ", width = 0.5) + geom_boxplot() #calculate summary statistics for each team tapply(df$Points, df$Team, summary)
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အကွက်ကွက်များအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
အကွက်ကွက်များကို နှိုင်းယှဉ်နည်း
Box Plots မှာ Asymmetry ကို ဘယ်လိုခွဲခြားသိနိုင်မလဲ။
boxplot တစ်ခုရဲ့ interquartile range ကို ဘယ်လိုရှာမလဲ။