R တွင် ထပ်နေသော မျဉ်းကြောင်းများကို မည်ကဲ့သို့ ဖယ်ရှားရမည်နည်း။
ရလာတဲ့ဒေတာဘောင်ထဲမှာ တစ်ခုမှမကျန် အောင် ဒေတာဘောင်တစ်ခုကနေ ထပ်နေတဲ့အတန်းတွေကို ဖယ်ရှားဖို့အတွက် R မှာရှိတဲ့ အောက်ပါနည်းလမ်းတွေကို အသုံးပြုနိုင်ပါတယ်။
နည်းလမ်း 1- Base R ကိုသုံးပါ။
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]
နည်းလမ်း 2: dplyr ကိုသုံးပါ။
library (dplyr) new_df <- df %>% group_by(across(everything())) %>% filter(n() == 1 )
အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည်-
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), points=c(20, 20, 28, 14, 13, 18, 27, 13)) #view data frame df team points 1 to 20 2 to 20 3 to 28 4 to 14 5 B 13 6 B 18 7 B 27 8 B 13
ဥပမာ 1- Base R ကိုသုံးပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်မှ ထပ်နေသောအတန်းများကို ဖယ်ရှားရန် R အခြေခံလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ပြသသည်-
#create new data frame that removes duplicates so none are left
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]
#view new data frame
new_df
team points
3 to 28
4 to 14
6 B 18
7 B 27
ပွားနေသောအတန်းတစ်ခုစီကို ဒေတာဘောင်မှ ဖယ်ရှားလိုက်ပြီး ထပ်နေသည့်အရာများကို သိမ်းဆည်းထားမည်မဟုတ်ကြောင်း သတိပြုပါ။
ဥပမာ 2- dplyr ကိုအသုံးပြုခြင်း။
အောက်ပါကုဒ်သည် ဒေတာဘောင်မှ ထပ်နေသောအတန်းများကို ဖယ်ရှားရန် R ရှိ dplyr ပက်ကေ့ခ်ျရှိ လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
library (dplyr)
#create new data frame that removes duplicates so none are left
new_df <- df %>%
group_by(across(everything())) %>%
filter(n() == 1 )
#view new data frame
new_df
# A tibble: 4 x 2
# Groups: team, points [4]
team points
1 to 28
2 to 14
3 B 18
4 B 27
ပွားနေသောအတန်းတစ်ခုစီကို ဒေတာဘောင်မှ ဖယ်ရှားလိုက်ပြီး ထပ်နေသည့်အရာများကို သိမ်းဆည်းထားမည်မဟုတ်ကြောင်း သတိပြုပါ။
၎င်းသည် ယခင်နည်းလမ်းအတိုင်း ရလဒ်ကို ထုတ်ပေးကြောင်းကိုလည်း သတိပြုပါ။
မှတ်ချက် – အလွန်ကြီးမားသောဒေတာဘောင်များအတွက်၊ dplyr နည်းလမ်းသည် base R နည်းလမ်းထက် ပိုမြန်လိမ့်မည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
အခြေအနေပေါ်မူတည်၍ R တွင် အတန်းများကို ဖျက်နည်း
R တွင် သီးခြားကော်လံတစ်ခုရှိ NA နှင့် အတန်းများကို မည်ကဲ့သို့ ဖျက်မည်နည်း။