Dplyr ကို အသုံးပြု၍ အတန်းများကို ဖျက်နည်း (ဥပမာများနှင့်အတူ)
dplyr ကို အသုံးပြု၍ R ရှိ ဒေတာဘောင်မှ အတန်းများကို ဖယ်ရှားရန် အောက်ပါ အခြေခံ အထားအသိုကို အသုံးပြုနိုင်သည်။
1. NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။
df %>%
n / A. omit ()
2. သီးခြားကော်လံတစ်ခုတွင် NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။
df %>% filter( ! is. na (column_name))
3. ထပ်တူများကို ဖယ်ရှားပါ။
df %>%
distinct()
4. အညွှန်းအနေအထားအရ အတန်းများကို ဖျက်ပါ။
df %>% filter( ! row_number() %in% c(1, 2, 4))
5. အခြေအနေပေါ်မူတည်၍ အတန်းများကို ဖျက်ပါ။
df %>%
filter(column1 == ' A ' | column2 > 8)
အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤနည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည်-
library (dplyr)
#create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C'),
points=c(4, NA, 7, 5, 9, 9),
assists=c(1, 3, 5, NA, 2, 2))
#view data frame
df
team points assists
1 to 4 1
2 A NA 3
3 B 7 5
4 B 5 NA
5 C 9 2
6 C 9 2
ဥပမာ 1- NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်မှ NA တန်ဖိုးများပါရှိသော မည်သည့်အတန်းကို ဖယ်ရှားရမည်ကို ပြသသည်-
#remove any row with NA df %>% n / A. omit () team points assists 1 to 4 1 3 B 7 5 5 C 9 2 6 C 9 2
ဥပမာ 2- သီးခြားကော်လံများတွင် NA ပါသည့် မည်သည့်အတန်းကိုမဆို ဖျက်ပါ။
အောက်ပါကုဒ်သည် သီးခြားကော်လံတစ်ခုရှိ NA တန်ဖိုးများပါရှိသော မည်သည့်အတန်းကိုမဆို ဖျက်နည်းကို ပြသသည်-
#remove any row with NA in 'points' column: df %>% filter( ! is. na (dots)) team points assists 1 to 4 1 2 B 7 5 3 B 5 NA 4 C 9 2 5 C 9 2
ဥပမာ 3- ပွားနေသောအတန်းများကို ဖယ်ရှားပါ။
အောက်ပါကုဒ်သည် ထပ်နေသောအတန်းများကို ဖယ်ရှားနည်းကို ပြသသည်-
#remove duplicate rows
df %>%
distinct()
team points assists
1 to 4 1
2 A NA 3
3 B 7 5
4 B 5 NA
5 C 9 2
ဥပမာ 4- အညွှန်းအနေအထားအရ အတန်းများကို ဖျက်ပါ။
အညွှန်းအနေအထားပေါ်မူတည်၍ အတန်းများကို ဖျက်နည်းကို အောက်ပါကုဒ်တွင် ပြသည်-
#remove rows 1, 2, and 4 df %>% filter( ! row_number() %in% c(1, 2, 4)) team points assists 1 B 7 5 2 C 9 2 3 C 9 2
ဥပမာ 5- အခြေအနေပေါ်မူတည်၍ အတန်းများကို ဖျက်ပါ။
အောက်ပါကုဒ်သည် သီးခြားအခြေအနေများပေါ်မူတည်၍ အတန်းများကို ဖျက်နည်းကို ပြသသည်-
#only keep rows where team is equal to 'A' or points is greater than 8 df %>% filter(column1 == ' A ' | column2 > 8) team points assists 1 to 4 1 2 A NA 3 3 C 9 2 4 C 9 2
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
dplyr ကို အသုံးပြု၍ အညွှန်းအလိုက် ကော်လံများကို မည်သို့ရွေးချယ်ရမည်နည်း။
dplyr ကို အသုံးပြု၍ အုပ်စုအလိုက် ကိန်းရှင်များကို စီရန်
NA ကို dplyr တွင် Zero ဖြင့် အစားထိုးနည်း