Dplyr ကို အသုံးပြု၍ အတန်းများကို ဖျက်နည်း (ဥပမာများနှင့်အတူ)


dplyr ကို အသုံးပြု၍ R ရှိ ဒေတာဘောင်မှ အတန်းများကို ဖယ်ရှားရန် အောက်ပါ အခြေခံ အထားအသိုကို အသုံးပြုနိုင်သည်။

1. NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။

 df %>%
  n / A. omit ()

2. သီးခြားကော်လံတစ်ခုတွင် NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။

 df %>%
filter( ! is. na (column_name))

3. ထပ်တူများကို ဖယ်ရှားပါ။

 df %>%
  distinct()

4. အညွှန်းအနေအထားအရ အတန်းများကို ဖျက်ပါ။

 df %>%
filter( ! row_number() %in% c(1, 2, 4))

5. အခြေအနေပေါ်မူတည်၍ အတန်းများကို ဖျက်ပါ။

 df %>%
  filter(column1 == ' A ' | column2 > 8)

အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤနည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည်-

 library (dplyr)

#create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C'),
                 points=c(4, NA, 7, 5, 9, 9),
                 assists=c(1, 3, 5, NA, 2, 2))

#view data frame
df

  team points assists
1 to 4 1
2 A NA 3
3 B 7 5
4 B 5 NA
5 C 9 2
6 C 9 2

ဥပမာ 1- NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်မှ NA တန်ဖိုးများပါရှိသော မည်သည့်အတန်းကို ဖယ်ရှားရမည်ကို ပြသသည်-

 #remove any row with NA
df %>%
  n / A. omit ()

  team points assists
1 to 4 1
3 B 7 5
5 C 9 2
6 C 9 2

ဥပမာ 2- သီးခြားကော်လံများတွင် NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။

အောက်ပါကုဒ်သည် သီးခြားကော်လံတစ်ခုရှိ NA တန်ဖိုးများပါရှိသော မည်သည့်အတန်းကိုမဆို ဖျက်နည်းကို ပြသသည်-

 #remove any row with NA in 'points' column:
df %>%
  filter( ! is. na (dots))

  team points assists
1 to 4 1
2 B 7 5
3 B 5 NA
4 C 9 2
5 C 9 2

ဥပမာ 3- ပွားနေသောအတန်းများကို ဖယ်ရှားပါ။

အောက်ပါကုဒ်သည် ထပ်နေသောအတန်းများကို ဖယ်ရှားနည်းကို ပြသသည်-

 #remove duplicate rows
df %>%
  distinct()

  team points assists
1 to 4 1
2 A NA 3
3 B 7 5
4 B 5 NA
5 C 9 2

ဥပမာ 4- အညွှန်းအနေအထားအရ အတန်းများကို ဖျက်ပါ။

အညွှန်းအနေအထားပေါ်မူတည်၍ အတန်းများကို ဖျက်နည်းကို အောက်ပါကုဒ်တွင် ပြသည်-

 #remove rows 1, 2, and 4
df %>%
filter( ! row_number() %in% c(1, 2, 4))

  team points assists
1 B 7 5
2 C 9 2
3 C 9 2

ဥပမာ 5- အခြေအနေပေါ်မူတည်၍ အတန်းများကို ဖျက်ပါ။

အောက်ပါကုဒ်သည် သီးခြားအခြေအနေများပေါ်မူတည်၍ အတန်းများကို ဖျက်နည်းကို ပြသသည်-

 #only keep rows where team is equal to 'A' or points is greater than 8
df %>%
  filter(column1 == ' A ' | column2 > 8)

  team points assists
1 to 4 1
2 A NA 3
3 C 9 2
4 C 9 2

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကို အသုံးပြု၍ အညွှန်းအလိုက် ကော်လံများကို မည်သို့ရွေးချယ်ရမည်နည်း။
dplyr ကို အသုံးပြု၍ အုပ်စုအလိုက် ကိန်းရှင်များကို စီရန်
NA ကို dplyr တွင် Zero ဖြင့် အစားထိုးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်