Dplyr ကို အသုံးပြု၍ ပွားနေသောဒြပ်စင်များကို မည်သို့ရှာရမည်နည်း။


သင်သည် dplyr ကို အသုံးပြု၍ ဒေတာဘောင်တစ်ခုအတွင်း ထပ်နေသောဒြပ်စင်များကို ရှာဖွေရန် အောက်ပါနည်းလမ်းများကို အသုံးပြုနိုင်သည်။

နည်းလမ်း 1- ပွားနေသောအတန်းအားလုံးကို ပြပါ။

 library (dplyr)

#display all duplicate rows
df %>%
  group_by_all() %>%
  filter(n()> 1 ) %>%
  A group()

နည်းလမ်း 2- ပွားနေသောအတန်းအားလုံးအတွက် ထပ်နေသောအရေအတွက်ကို ပြပါ။

 library (dplyr)

#display duplicate count for all duplicated rows
df %>%
  add_count(col1, col2, col3) %>%
  filter(n> 1 ) %>%
  distinct()

ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ဖြင့် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ရှင်းပြထားသည်။

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(10, 10, 8, 14, 15, 15, 17, 17))

#view data frame
df

  team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17

ဥပမာ 1- ပွားနေသောအတန်းအားလုံးကို ပြပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်တွင် ပွားနေသောအတန်းအားလုံးကို မည်သို့ပြသရမည်ကို ပြသသည်-

 library (dplyr)

#display all duplicate rows in data frame
df %>%
  group_by_all() %>%
  filter(n()> 1 ) %>%
  A group()

# A tibble: 6 x 3
  team position points
        
1 AG 10
2 AG 10
3 BG 15
4 BG 15
5 BF 17
6 BF 17

ရလဒ်မှာ အတန်း 6 တန်းပါရှိသော ဒေတာဘောင်တစ်ခုဖြစ်ပြီး တစ်ခုစီသည် ပွားနေသောအတန်းတစ်ခုဖြစ်သည်။

မှတ်ချက် – မည်သည့်အတန်းများသည် သတ်မှတ်ထားသောကော်လံများတွင် တူညီသောတန်ဖိုးများရှိသည်ကို သိလိုပါက၊ အဖွဲ့ ကော်လံတွင်သာ တန်ဖိုးများထပ်နေသည့်အတန်းများကို ရှာဖွေရန် group_by(team) ကဲ့သို့သော အရာကို အသုံးပြုနိုင်သည်။

ဥပမာ 2- ပွားနေသောအတန်းအားလုံးအတွက် ထပ်နေသောအရေအတွက်ကို ပြပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ ပွားနေသောအတန်းအားလုံးအတွက် ပွားနေသောအရေအတွက်ကို ပြသနည်းကို ပြသသည်-

 library (dplyr)

#display duplicate count for each row
df %>%
  add_count(team, position, points) %>%
  filter(n> 1 ) %>%
  distinct()

  team position points n
1 GA 10 2
2 BG 15 2
3 BF 17 2

ကော်လံ n သည် အတန်းတစ်ခုစီအတွက် ထပ်နေသော စုစုပေါင်းအရေအတွက်ကို ပြသသည်။

ဥပမာအားဖြင့်:

  • A၊ G နှင့် 10 တန်ဖိုးများပါသော စာကြောင်းသည် data block တွင် 2 ကြိမ်ပေါ်လာသည်။
  • တန်ဖိုးများ B၊ G နှင့် 15 ပါသော စာကြောင်းသည် data block တွင် 2 ကြိမ်ပေါ်လာသည်။
  • တန်ဖိုးများ B၊ F နှင့် 17 ပါသော စာကြောင်းသည် data block တွင် 2 ကြိမ်ပေါ်လာသည်။

မှတ်ချက် – မည်သည့်အတန်းများသည် သီးခြားကော်လံများတွင် ထပ်တူတန်ဖိုးများရှိသည်ကို သိလိုပါက add_count() လုပ်ဆောင်ချက်တွင် အဆိုပါ သီးခြားကော်လံများကိုသာ ထည့်သွင်းပါ။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကို အသုံးပြု၍ ထူးခြားသောတန်ဖိုးများကို စစ်ထုတ်နည်း
dplyr ကို အသုံးပြု၍ အခြေအနေများစွာဖြင့် စစ်ထုတ်နည်း
R ရှိ ကော်လံများတွင် ဖြစ်ပွားမှုအရေအတွက်ကို ရေတွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်