ဥပမာများဖြင့် r တွင် ထပ်တူများကို ရေတွက်နည်း


R ရှိ ဒေတာဘောင်တစ်ခုရှိ မိတ္တူပွားများကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်သုံးနိုင်သည်။

နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထပ်နေသောတန်ဖိုးများကို ရေတွက်ပါ။

 sum(duplicated(df$my_column))

နည်းလမ်း 2- ပွားနေသောအတန်းများကို ရေတွက်ပါ။

 nrow(df[duplicated(df), ])

နည်းလမ်း 3- တစ်မူထူးခြားသောအတန်းတစ်ခုစီအတွက် ထပ်တူများကိုရေတွက်ပါ။

 library (dplyr)

df %>% group_by_all() %>% count

အောက်ဖော်ပြပါ ဥပမာများသည် R ရှိ ဒေတာဘောင်ဖြင့် လက်တွေ့တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုနည်းကို ပြသသည်-

 #create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
                points=c(5, 5, 8, 10, 5, 7, 10, 10))

#view data frame
df

  team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10

ဥပမာ 1- ကော်လံတစ်ခုတွင် ထပ်နေသောတန်ဖိုးများကို ရေတွက်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် အမှတ်များ ကော်လံရှိ ထပ်နေသော တန်ဖိုးများ အရေအတွက်ကို ရေတွက်နည်းကို ပြသည်-

 #count number of duplicate values in points column
sum(duplicated(df$points))

[1] 4

အမှတ်များ ကော်လံတွင် မိနေသောတန်ဖိုး 4 ခု ရှိကြောင်း ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။

ဥပမာ 2- ပွားနေသောအတန်းများကို ရေတွက်ပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ ထပ်နေသည့်အတန်းအရေအတွက်ကို ရေတွက်နည်းကို ပြသသည်-

 #count number of duplicate rows
nrow(df[duplicated(df), ])

[1] 2

ဒေတာဘောင်တွင် ပွားနေသော အတန်း 2 ကြောင်းကို ကျွန်ုပ်တို့ တွေ့နိုင်ပါသည်။

ဤထပ်နေသောစာကြောင်း 2 ခုကိုပြသရန် အောက်ပါ syntax ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည်-

 #display duplicated rows
df[duplicated(df), ]

  team position points
2 AG 5
8 BF 10

ဥပမာ 3- တစ်မူထူးခြားသောအတန်းတစ်ခုစီအတွက် ထပ်တူများကိုရေတွက်ပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်ရှိ သီးသန့်အတန်းတစ်ခုစီအတွက် ထပ်နေသောအရေအတွက်ကို ရေတွက်နည်းကို ပြသသည်-

 library (dplyr)

#count number of duplicate rows in data frame
df %>% group_by_all() %>% count

# A tibble: 6 x 4
# Groups: team, position, points [6]
  team position points n
         
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1

ကော်လံ n သည် သီးသန့်အတန်းတစ်ခုစီအတွက် ထပ်နေသောအရေအတွက်ကို ပြသသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကို အသုံးပြု၍ ထပ်နေသောဒြပ်စင်များကို မည်သို့ရှာရမည်နည်း။
R တွင် ထပ်နေသော လိုင်းများကို မည်ကဲ့သို့ ဖယ်ရှားနည်း
R တွင် ထပ်နေသော မျဉ်းကြောင်းများကို မည်ကဲ့သို့ ဖယ်ရှားရမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်