R ရှိ boxplots တွင် outliers များကိုမည်သို့ဖယ်ရှားနည်း
တစ်ခါတစ်ရံတွင် သင်သည် R ရှိ boxplots များမှ outliers များကို ဖယ်ရှားလိုပေမည်။
ဤသင်ခန်းစာတွင် base R နှင့် ggplot2 နှစ်မျိုးလုံးကို အသုံးပြု၍ ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။
Base R ရှိ ဘောက်စ်ကွက်များရှိ အစွန်းများကို ဖယ်ရှားပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
အောက်ဖော်ပြပါကုဒ်သည် အခြေခံ R တွင် ဤဒေတာအတွဲအတွက် boxplot ဖန်တီးနည်းကို ပြသသည်-
boxplot(data)

outliers များကို ဖယ်ရှားရန်၊ သင်သည် outline=FALSE အကြောင်းပြချက်ကို အသုံးပြုနိုင်သည်။
boxplot(data, outline= FALSE )

ggplot2 ရှိ boxplot များရှိ outliers များကို ဖယ်ရှားပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
အောက်ဖော်ပြပါကုဒ်သည် ggplot2 ပုံရိပ်ယောင်ပြစာကြည့်တိုက်ကို အသုံးပြု၍ boxplot ဖန်တီးနည်းကို ပြသသည်-
library (ggplot2) ggplot(data, aes(y=y)) + geom_boxplot ()

အစွန်းအထင်းများကို ဖယ်ရှားရန်၊ သင်သည် outlier.shape=NA အငြင်းအခုံကို အသုံးပြုနိုင်သည်။
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA )

ggplot2 သည် y ဝင်ရိုးကို အလိုအလျောက်ချိန်ညှိခြင်းမရှိကြောင်း သတိပြုပါ။
y ဝင်ရိုးကို ချိန်ညှိရန် coord_cartesian ကို သုံးနိုင်သည်။
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA ) + coord_cartesian (ylim=c(5, 30))

ylim() အငြင်းအခုံကိုအသုံးပြု၍ ကျွန်ုပ်တို့သတ်မှတ်ထားသည့်အတိုင်း y-ဝင်ရိုးသည် 5 မှ 30 အထိ ရှိသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ggplot2 တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
ggplot2 တွင် ဝင်ရိုးကန့်သတ်ချက်များကို မည်သို့သတ်မှတ်မည်နည်း။
ggplot2 တွင် ဘေးချင်းကပ်ကွက်များ ဖန်တီးနည်း
ggplot2 ရှိ boxplot များတွင် outliers တံဆိပ်တပ်နည်း