ဥပမာများဖြင့် r တွင် ထပ်တူများကို ရေတွက်နည်း
R ရှိ ဒေတာဘောင်တစ်ခုရှိ မိတ္တူပွားများကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်သုံးနိုင်သည်။
နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထပ်နေသောတန်ဖိုးများကို ရေတွက်ပါ။
sum(duplicated(df$my_column))
နည်းလမ်း 2- ပွားနေသောအတန်းများကို ရေတွက်ပါ။
nrow(df[duplicated(df), ])
နည်းလမ်း 3- တစ်မူထူးခြားသောအတန်းတစ်ခုစီအတွက် ထပ်တူများကိုရေတွက်ပါ။
library (dplyr)
df %>% group_by_all() %>% count
အောက်ဖော်ပြပါ ဥပမာများသည် R ရှိ ဒေတာဘောင်ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-
#create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
points=c(5, 5, 8, 10, 5, 7, 10, 10))
#view data frame
df
team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10
ဥပမာ 1- ကော်လံတစ်ခုတွင် ထပ်နေသောတန်ဖိုးများကို ရေတွက်ပါ။
အောက်ဖော်ပြပါ ကုဒ်သည် အမှတ်များ ကော်လံရှိ ထပ်နေသော တန်ဖိုးများ အရေအတွက်ကို ရေတွက်နည်းကို ပြသည်-
#count number of duplicate values in points column
sum(duplicated(df$points))
[1] 4
အမှတ်များ ကော်လံတွင် မိနေသောတန်ဖိုး 4 ခု ရှိကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဥပမာ 2- ပွားနေသောအတန်းများကို ရေတွက်ပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ ထပ်နေသည့်အတန်းအရေအတွက်ကို ရေတွက်နည်းကို ပြသသည်-
#count number of duplicate rows
nrow(df[duplicated(df), ])
[1] 2
ဒေတာဘောင်တွင် ပွားနေသော အတန်း 2 ကြောင်းကို ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။
ဤထပ်နေသောစာကြောင်း 2 ခုကိုပြသရန် အောက်ပါ syntax ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-
#display duplicated rows
df[duplicated(df), ]
team position points
2 AG 5
8 BF 10
ဥပမာ 3- တစ်မူထူးခြားသောအတန်းတစ်ခုစီအတွက် ထပ်တူများကိုရေတွက်ပါ။
အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ သီးသန့်အတန်းတစ်ခုစီအတွက် ထပ်နေသောအရေအတွက်ကို ရေတွက်နည်းကို ပြသသည်-
library (dplyr)
#count number of duplicate rows in data frame
df %>% group_by_all() %>% count
# A tibble: 6 x 4
# Groups: team, position, points [6]
team position points n
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1
ကော်လံ n သည် သီးသန့်အတန်းတစ်ခုစီအတွက် ထပ်နေသောအရေအတွက်ကို ပြသသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
dplyr ကို အသုံးပြု၍ ထပ်နေသောဒြပ်စင်များကို မည်သို့ရှာရမည်နည်း။
R တွင် ထပ်နေသော လိုင်းများကို မည်ကဲ့သို့ ဖယ်ရှားနည်း
R တွင် ထပ်နေသော မျဉ်းကြောင်းများကို မည်ကဲ့သို့ ဖယ်ရှားရမည်နည်း။