Outliers ဖြင့် box plot ကိုမည်သို့ဖတ်နည်း (ဥပမာနှင့်အတူ)


အကွက်ကွက်ကွက် သည် ဂဏန်းငါးလုံးအကျဉ်းချုပ်ကို ဖော်ပြသည့် ကွက်ကွက်အမျိုးအစားတစ်ခုဖြစ်ပြီး၊ ၎င်းပါဝင်သည်-

  • အနိမ့်ဆုံးတန်ဖိုး
  • ပထမ quartile (၂၅ ခုမြောက် ရာခိုင်နှုန်း)
  • ပျမ်းမျှတန်ဖိုး
  • တတိယ ကွာတား (၇၅ ခုမြောက် ရာခိုင်နှုန်း)၊
  • အများဆုံးတန်ဖိုး

အကွက်ကွက်ကွက်တစ်ခုပြုလုပ်ရန် ပထမအကြိမ်မှ တတိယမြောက် လေးပုံးတစ်ကွက်ကို ဦးစွာဆွဲပါ။

ထို့နောက် အလယ်ဗဟိုတွင် ဒေါင်လိုက်မျဉ်းတစ်ခုဆွဲပါ။

နောက်ဆုံးတွင်၊ ကျွန်ုပ်တို့သည် အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးတန်ဖိုးအထိ quartiles များ၏ “ ပါးသိုင်းမွှေးများ” ကို ဆွဲပါသည်။

စာရင်းအင်းဆော့ဖ်ဝဲအများစုတွင်၊ အောက်ပါလိုအပ်ချက်နှစ်ခုအနက်မှတစ်ခုနှင့်ကိုက်ညီပါက စောင့်ကြည့်မှုတစ်ခုကို အကြမ်းဖျင်းအဖြစ် သတ်မှတ်သည်-

  • စူးစမ်းလေ့လာမှုသည် ပထမ quartile (Q1) အောက်ရှိ interquartile range ၏ 1.5 ဆ၊
  • စူးစမ်းလေ့လာမှုသည် တတိယ quartile (Q3) ထက် ကွာတားအကွာအဝေးထက် 1.5 ဆဖြစ်သည်။

ဒေတာအတွဲတစ်ခုတွင် အစွန်းအထင်းတစ်ခုရှိနေပါက၊ ၎င်းကို အကွက်ကွက်ကွက်ရှိ ပါးသိုင်းမွှေးအကွာအဝေးအပြင်ဘက်တွင် အစက်ငယ်ဖြင့် တံဆိပ်တပ်လေ့ရှိသည်-

boxplots တွင် outliers ကိုဘယ်လိုဖတ်မလဲ။

ဤသို့ဖြစ်လာသောအခါ၊ boxplot ရှိ “ အနည်းဆုံး” နှင့် “ အမြင့်ဆုံး” တန်ဖိုးများကို Q1 – 1.5*IQR နှင့် Q3 + 1.5*IQR တို့၏တန်ဖိုးများကို အသီးသီးသတ်မှတ်ပေးပါသည်။

အောက်ဖော်ပြပါ ဥပမာသည် အကွက်ကွက်ကွက်များကို အစွန်းအဖျားများဖြင့် အဓိပ္ပါယ်ဖွင့်ဆိုပုံတို့ကို ပြသထားသည်။

ဥပမာ- Outliers ဖြင့် Box Plot ကို ဘာသာပြန်ခြင်း။

မတူညီသောအသင်းနှစ်သင်းမှ ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များခွဲဝေမှုကိုမြင်ယောင်နိုင်ရန် အောက်ပါအကွက်နှစ်ခုကို ဖန်တီးသည်ဆိုပါစို့။

Team A အတွက် ဘယ်ဘက်ကွက်လပ်တွင် အနိမ့်ဆုံး သို့မဟုတ် အများဆုံး ပါးသိုင်းမွှေး၏ အပြင်ဘက်တွင် အစက်ငယ်များ မရှိသောကြောင့် အစွန်းထွက်များ မရှိပါ။

သို့သော်၊ Team B အတွက် ညာဘက်ထောင့်ကွက်တွင် “ အမြင့်ဆုံး” တန်ဖိုးနှင့် “ အနည်းဆုံး” တန်ဖိုးအောက် အစွန်းတစ်ခုရှိသည်။

ဤသည်မှာ Team B အတွက် “ Points” variable ဖြန့်ချီခြင်းအတွက် လက်ရှိဂဏန်းငါးလုံးအကျဉ်းချုပ်ဖြစ်ပါသည်-

  • အနိမ့်ဆုံးတန်ဖိုး- 1.1
  • ပထမအကြိမ်- ၁၀.၅
  • ပျမ်းမျှ- ၁၂.၇
  • တတိယအကြိမ်- ၁၅.၆
  • အများဆုံးတန်ဖိုး- 23.5

ဤသည်မှာ ဖြစ်နိုင်ချေရှိသော အကွာအဝေးများ၏ ကန့်သတ်ချက်များကို တွက်ချက်နည်းဖြစ်သည်။

Interquartile scale : တတိယ quartile – ပထမ quartile = 15.6 – 10.5 = 5.1

အနိမ့်ဆုံးကန့်သတ်ချက် – Q1 – 1.5*IQR = 10.5 – 1.5*5.1 = 2.85

အထက်ကန့်သတ်ချက် – Q3 + 1.5*IQR = 15.6 + 1.5*5.1 = 23.25

boxplot ရှိ အနိမ့်ဆုံးနှင့် အမြင့်ဆုံးတန်ဖိုးများအတွက် ပါးသိုင်းမွှေးများကို 2.85 နှင့် 23.25 တွင်ထားရှိပါသည်။

ထို့ကြောင့်၊ 1.1 နှင့် 23.5 တန်ဖိုးများရှိသော လေ့လာတွေ့ရှိချက်များသည် ၎င်းတို့သည် အောက်ပိုင်းနှင့် အထက်ဘောင်များအပြင်ဘက်တွင် ကျရောက်သောကြောင့် boxplot တွင် outliers အဖြစ် အရည်အချင်းပြည့်မီပါသည်။

အပိုဆု – ဤသည်မှာ R ပရိုဂရမ်းမင်းဘာသာစကားဖြင့် ဤ boxplots နှစ်ခုကို ဖန်တီးရန် ကျွန်ုပ်တို့အသုံးပြုခဲ့သော ကုဒ်အတိအကျဖြစ်သည်-

 library (ggplot2)

#make this example reproducible 
set. seeds (2)

#create data frame
df <- data. frame (Team = factor(rep(c("A", "B"), each = 200)), 
                 Points = c(rnorm(200, mean = 15, sd = 3), 
                           rnorm(200, mean = 12, sd = 4))) 

#create box plots
ggplot(df, aes(x = Team, y = Points)) +
  stat_boxplot(geom = " errorbar ", width = 0.5) +  
  geom_boxplot() 

#calculate summary statistics for each team
tapply(df$Points, df$Team, summary)

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အကွက်ကွက်များအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-

အကွက်ကွက်များကို နှိုင်းယှဉ်နည်း
Box Plots မှာ Asymmetry ကို ဘယ်လိုခွဲခြားသိနိုင်မလဲ။
boxplot တစ်ခုရဲ့ interquartile range ကို ဘယ်လိုရှာမလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်