Dplyr (ဥပမာများနှင့်အတူ) ကွဲပြားသောတန်ဖိုးများကို ရေတွက်နည်း


dplyr ‘s n_distinct() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ R ဒေတာဘောင်ရှိ ထူးခြားသောတန်ဖိုးများ အရေအတွက်ကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်-

နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

 n_distinct(df$column_name)

နည်းလမ်း 2: ကော်လံအားလုံးတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

 sapply(df, function (x) n_distinct(x))

Method 3: အုပ်စုအလိုက်ကွဲပြားသောတန်ဖိုးများကိုရေတွက်ပါ။

 df %>%
group_by (grouping_column) %>%
summarize (count_distinct = n_distinct(values_column))

အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤနည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည်-

 library (dplyr)

#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(6, 6, 8, 10, 9, 9, 12, 12),
                 assists=c(3, 6, 4, 2, 4, 5, 5, 9))

#view data frame
df

  team points assists
1 to 6 3
2 to 6 6
3 to 8 4
4 to 10 2
5 B 9 4
6 B 9 5
7 B 12 5
8 B 12 9

နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

အောက်ပါကုဒ်သည် ‘အဖွဲ့’ ကော်လံရှိ ထူးခြားသောတန်ဖိုးများရေတွက်ရန် n_distinct() ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #count distinct values in 'team' column
n_distinct(df$team)

[1] 2

‘အဖွဲ့’ ကော်လံတွင် မတူညီသော တန်ဖိုး 2 ခု ရှိပါသည်။

နည်းလမ်း 2: ကော်လံအားလုံးတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်ကော်လံတစ်ခုစီရှိ ကွဲပြားသောတန်ဖိုးအရေအတွက်ကို ရေတွက်ရန် sapply() နှင့် n_distinct() လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #count distinct values in every column
sapply(df, function (x) n_distinct(x))

   team points assists 
      2 5 6

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • ‘အဖွဲ့’ ကော်လံတွင် မတူညီသော တန်ဖိုး 2 ခု ရှိပါသည်။
  • “အမှတ်များ” ကော်လံတွင် ထူးခြားသောတန်ဖိုး ၅ ခု ရှိသည်။
  • “အကူအညီ” ကော်လံတွင် ကွဲပြားသောတန်ဖိုး ၆ ခု ရှိသည်။

Method 3: အုပ်စုအလိုက်ကွဲပြားသောတန်ဖိုးများကိုရေတွက်ပါ။

အုပ်စုအလိုက်ကွဲပြားသောတန်ဖိုးများရေတွက်ရန် n_distinct() လုပ်ဆောင်ချက်ကို အောက်ပါကုဒ်တွင် ဖော်ပြသည်-

 #count distinct 'points' values by 'team'
df %>%
  group_by (team) %>%
  summarize (distinct_points = n_distinct(points))

# A tibble: 2 x 2
  team distinct_points 
1 to 3
2 B 2

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • Team A အတွက် ထူးခြားသော အမှတ်တန်ဖိုး ၃ ခု ရှိပါသည်။
  • Team B အတွက် သီးခြားအမှတ်တန်ဖိုး 2 ခု ရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr ကိုအသုံးပြု၍ အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကိုသုံးပြီး တန်ဖိုးတွေကို ဘယ်လိုပြန်ကုဒ်မလဲ။
NA ကို dplyr တွင် Zero ဖြင့် အစားထိုးနည်း
dplyr ကို အသုံးပြု၍ အုပ်စုအလိုက် ကိန်းရှင်များကို စီရန်
dplyr ကိုသုံးပြီး အုပ်စုအလိုက် ပထမအတန်းကို ဘယ်လိုရွေးမလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်