Dplyr ကို အသုံးပြု၍ ပွားနေသောဒြပ်စင်များကို မည်သို့ရှာရမည်နည်း။
သင်သည် dplyr ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုအတွင်း ထပ်နေသောဒြပ်စင်များကို ရှာဖွေရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။
နည်းလမ်း 1- ပွားနေသောအတန်းအားလုံးကို ပြပါ။
library (dplyr) #display all duplicate rows df %>% group_by_all() %>% filter(n()> 1 ) %>% A group()
နည်းလမ်း 2- ပွားနေသောအတန်းအားလုံးအတွက် ထပ်နေသောအရေအတွက်ကို ပြပါ။
library (dplyr)
#display duplicate count for all duplicated rows
df %>%
add_count(col1, col2, col3) %>%
filter(n> 1 ) %>%
distinct()
ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ဖြင့် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ရှင်းပြထားသည်။
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
points=c(10, 10, 8, 14, 15, 15, 17, 17))
#view data frame
df
team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17
ဥပမာ 1- ပွားနေသောအတန်းအားလုံးကို ပြပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်တွင် ပွားနေသောအတန်းအားလုံးကို မည်သို့ပြသရမည်ကို ပြသသည်-
library (dplyr)
#display all duplicate rows in data frame
df %>%
group_by_all() %>%
filter(n()> 1 ) %>%
A group()
# A tibble: 6 x 3
team position points
1 AG 10
2 AG 10
3 BG 15
4 BG 15
5 BF 17
6 BF 17
ရလဒ်မှာ အတန်း 6 တန်းပါရှိသော ဒေတာဘောင်တစ်ခုဖြစ်ပြီး တစ်ခုစီသည် ပွားနေသောအတန်းတစ်ခုဖြစ်သည်။
မှတ်ချက် – မည်သည့်အတန်းများသည် သတ်မှတ်ထားသောကော်လံများတွင် တူညီသောတန်ဖိုးများရှိသည်ကို သိလိုပါက၊ အဖွဲ့ ကော်လံတွင်သာ တန်ဖိုးများထပ်နေသည့်အတန်းများကို ရှာဖွေရန် group_by(team) ကဲ့သို့သော အရာကို အသုံးပြုနိုင်သည်။
ဥပမာ 2- ပွားနေသောအတန်းအားလုံးအတွက် ထပ်နေသောအရေအတွက်ကို ပြပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ ပွားနေသောအတန်းအားလုံးအတွက် ပွားနေသောအရေအတွက်ကို ပြသနည်းကို ပြသသည်-
library (dplyr)
#display duplicate count for each row
df %>%
add_count(team, position, points) %>%
filter(n> 1 ) %>%
distinct()
team position points n
1 GA 10 2
2 BG 15 2
3 BF 17 2
ကော်လံ n သည် အတန်းတစ်ခုစီအတွက် ထပ်နေသော စုစုပေါင်းအရေအတွက်ကို ပြသသည်။
ဥပမာအားဖြင့်:
- A၊ G နှင့် 10 တန်ဖိုးများပါသော စာကြောင်းသည် data block တွင် 2 ကြိမ်ပေါ်လာသည်။
- တန်ဖိုးများ B၊ G နှင့် 15 ပါသော စာကြောင်းသည် data block တွင် 2 ကြိမ်ပေါ်လာသည်။
- တန်ဖိုးများ B၊ F နှင့် 17 ပါသော စာကြောင်းသည် data block တွင် 2 ကြိမ်ပေါ်လာသည်။
မှတ်ချက် – မည်သည့်အတန်းများသည် သီးခြားကော်လံများတွင် ထပ်တူတန်ဖိုးများရှိသည်ကို သိလိုပါက add_count() လုပ်ဆောင်ချက်တွင် အဆိုပါ သီးခြားကော်လံများကိုသာ ထည့်သွင်းပါ။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
dplyr ကို အသုံးပြု၍ ထူးခြားသောတန်ဖိုးများကို စစ်ထုတ်နည်း
dplyr ကို အသုံးပြု၍ အခြေအနေများစွာဖြင့် စစ်ထုတ်နည်း
R ရှိ ကော်လံများတွင် ဖြစ်ပွားမှုအရေအတွက်ကို ရေတွက်နည်း