R ရှိ boxplots တွင် outliers များကိုမည်သို့ဖယ်ရှားနည်း


တစ်ခါတစ်ရံတွင် သင်သည် R ရှိ boxplots များမှ outliers များကို ဖယ်ရှားလိုပေမည်။

ဤသင်ခန်းစာတွင် base R နှင့် ggplot2 နှစ်မျိုးလုံးကို အသုံးပြု၍ ၎င်းကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြထားသည်။

Base R ရှိ ဘောက်စ်ကွက်များရှိ အစွန်းများကို ဖယ်ရှားပါ။

ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

အောက်ဖော်ပြပါကုဒ်သည် အခြေခံ R တွင် ဤဒေတာအတွဲအတွက် boxplot ဖန်တီးနည်းကို ပြသသည်-

 boxplot(data)

outliers များကို ဖယ်ရှားရန်၊ သင်သည် outline=FALSE အကြောင်းပြချက်ကို အသုံးပြုနိုင်သည်။

 boxplot(data, outline= FALSE ) 

R တွင် အကြမ်းဖျင်းဖယ်ရှားထားသော Boxplot

ggplot2 ရှိ boxplot များရှိ outliers များကို ဖယ်ရှားပါ။

ကျွန်ုပ်တို့တွင် အောက်ပါဒေတာအစုံရှိသည်ဆိုပါစို့။

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

အောက်ဖော်ပြပါကုဒ်သည် ggplot2 ပုံရိပ်ယောင်ပြစာကြည့်တိုက်ကို အသုံးပြု၍ boxplot ဖန်တီးနည်းကို ပြသသည်-

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

အစွန်းအထင်းများကို ဖယ်ရှားရန်၊ သင်သည် outlier.shape=NA အငြင်းအခုံကို အသုံးပြုနိုင်သည်။

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

ggplot2 အစွန်းထွက်များပါရှိသော boxplot ကိုဖယ်ရှားပါ။

ggplot2 သည် y ဝင်ရိုးကို အလိုအလျောက်ချိန်ညှိခြင်းမရှိကြောင်း သတိပြုပါ။

y ဝင်ရိုးကို ချိန်ညှိရန် coord_cartesian ကို သုံးနိုင်သည်။

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

အစွန်းထွက်များမပါဘဲ boxplot ggplot2

ylim() အငြင်းအခုံကိုအသုံးပြု၍ ကျွန်ုပ်တို့သတ်မှတ်ထားသည့်အတိုင်း y-ဝင်ရိုးသည် 5 မှ 30 အထိ ရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ggplot2 တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

ggplot2 တွင် ဝင်ရိုးကန့်သတ်ချက်များကို မည်သို့သတ်မှတ်မည်နည်း။
ggplot2 တွင် ဘေးချင်းကပ်ကွက်များ ဖန်တီးနည်း
ggplot2 ရှိ boxplot များတွင် outliers တံဆိပ်တပ်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်