R ရှိ ကော်လံများစွာမှ အစွန်းများကို ဖယ်ရှားနည်း


မကြာခဏဆိုသလို R ဖြင့် ကော်လံအများအပြားမှ အစွန်းများကို ဖယ်ရှားလိုပေမည်။

အကြမ်းဖျင်းအဖြစ် ရှုမြင်မှုတစ်ခုကို သတ်မှတ်ရန် ဘုံနည်းလမ်းမှာ တတိယ quartile (Q3) ထက် 1.5 ဆ သို့မဟုတ် ပထမ quartile (Q1) အောက်ရှိ interquartile အပိုင်းအခြား၏ 1.5 ဆ ဖြစ်သည်။

ဤအဓိပ္ပါယ်ဖွင့်ဆိုချက်အားအသုံးပြုခြင်းဖြင့်၊ အကြမ်းဖျင်းများကိုခွဲခြားသတ်မှတ်ရန် ရိုးရှင်းသောလုပ်ဆောင်ချက်ကိုဖန်တီးရန်နှင့် R ဒေတာဘောင်ရှိ ကော်လံအများအပြားတွင် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

အဆင့် 1- ဒေတာဘောင်တစ်ခု ဖန်တီးပါ။

R တွင် ဒေတာဘောင်တစ်ခု ဖန်တီးခြင်းဖြင့် စတင်ကြပါစို့။

 df <- data.frame(index=c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10),
                 var1=c(4, 4, 5, 4, 3, 2, 8, 9, 4, 5),
                 var2=c(1, 2, 4, 4, 6, 9, 7, 8, 5, 29),
                 var3=c(9, 9, 9, 5, 5, 3, 4, 5, 11, 34))

အဆင့် 2- ပြင်ပလုပ်ဆောင်ချက်ကို သတ်မှတ်ပါ။

နောက်တစ်ခု၊ outliers များကိုခွဲခြားသတ်မှတ်နိုင်သော function နှင့် outliers များကိုဖယ်ရှားနိုင်သည့် function ကိုသတ်မှတ်ကြပါစို့။

 outliers <- function (x) {

  Q1 <- quantile(x, probs =.25)
  Q3 <- quantile(x, probs =.75)
  iqr = Q3-Q1

 upper_limit = Q3 + (iqr*1.5)
 lower_limit = Q1 - (iqr*1.5)

 x > upper_limit | x < lower_limit
}

remove_outliers <- function (df, cols = names (df)) {
  for (col in cols) {
    df <- df[!outliers(df[[col]]),]
  }
  df
}

အဆင့် 3- ပြင်ပလုပ်ဆောင်ချက်ကို ဒေတာဘောင်တွင် အသုံးပြုပါ။

နောက်ဆုံးတွင်၊ outliers များကိုဖယ်ရှားရန် data frame ကော်လံအများအပြားတွင် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုကြပါစို့။

 remove_outliers(df, c('var1', 'var2', 'var3'))

  index var1 var2 var3
1 1 4 1 9
2 2 4 2 9
3 3 5 4 9
4 4 4 4 5
5 5 3 6 5
9 9 4 5 11

နောက်ထပ် R သင်ခန်းစာများကို ဤနေရာတွင် ရှာဖွေနိုင်ပါသည်။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်