Dplyr (ဥပမာများနှင့်အတူ) ကွဲပြားသောတန်ဖိုးများကို ရေတွက်နည်း

အားဖြင့် Benjamin Anderson ဇူလိုင် 23, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

dplyr ‘s n_distinct() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ R ဒေတာဘောင်ရှိ ထူးခြားသောတန်ဖိုးများ အရေအတွက်ကို ရေတွက်ရန် အောက်ပါနည်းလမ်းများကို သင်အသုံးပြုနိုင်သည်-

နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

 n_distinct(df$column_name)

နည်းလမ်း 2: ကော်လံအားလုံးတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

 sapply(df, function (x) n_distinct(x))

Method 3: အုပ်စုအလိုက်ကွဲပြားသောတန်ဖိုးများကိုရေတွက်ပါ။

 df %>%
group_by (grouping_column) %>%
summarize (count_distinct = n_distinct(values_column))

အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤနည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည်-

 library (dplyr)

#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(6, 6, 8, 10, 9, 9, 12, 12),
                 assists=c(3, 6, 4, 2, 4, 5, 5, 9))

#view data frame
df

  team points assists
1 to 6 3
2 to 6 6
3 to 8 4
4 to 10 2
5 B 9 4
6 B 9 5
7 B 12 5
8 B 12 9

နည်းလမ်း 1: ကော်လံတစ်ခုတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

အောက်ပါကုဒ်သည် ‘အဖွဲ့’ ကော်လံရှိ ထူးခြားသောတန်ဖိုးများရေတွက်ရန် n_distinct() ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #count distinct values in 'team' column
n_distinct(df$team)

[1] 2

‘အဖွဲ့’ ကော်လံတွင် မတူညီသော တန်ဖိုး 2 ခု ရှိပါသည်။

နည်းလမ်း 2: ကော်လံအားလုံးတွင် ထူးခြားသောတန်ဖိုးများကို ရေတွက်ပါ။

အောက်ပါကုဒ်သည် ဒေတာဘောင်ကော်လံတစ်ခုစီရှိ ကွဲပြားသောတန်ဖိုးအရေအတွက်ကို ရေတွက်ရန် sapply() နှင့် n_distinct() လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #count distinct values in every column
sapply(df, function (x) n_distinct(x))

   team points assists 
      2 5 6

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

‘အဖွဲ့’ ကော်လံတွင် မတူညီသော တန်ဖိုး 2 ခု ရှိပါသည်။
“အမှတ်များ” ကော်လံတွင် ထူးခြားသောတန်ဖိုး ၅ ခု ရှိသည်။
“အကူအညီ” ကော်လံတွင် ကွဲပြားသောတန်ဖိုး ၆ ခု ရှိသည်။

Method 3: အုပ်စုအလိုက်ကွဲပြားသောတန်ဖိုးများကိုရေတွက်ပါ။

အုပ်စုအလိုက်ကွဲပြားသောတန်ဖိုးများရေတွက်ရန် n_distinct() လုပ်ဆောင်ချက်ကို အောက်ပါကုဒ်တွင် ဖော်ပြသည်-

 #count distinct 'points' values by 'team'
df %>%
  group_by (team) %>%
  summarize (distinct_points = n_distinct(points))

# A tibble: 2 x 2
  team distinct_points 
1 to 3
2 B 2

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

Team A အတွက် ထူးခြားသော အမှတ်တန်ဖိုး ၃ ခု ရှိပါသည်။
Team B အတွက် သီးခြားအမှတ်တန်ဖိုး 2 ခု ရှိသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr ကိုအသုံးပြု၍ အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကိုသုံးပြီး တန်ဖိုးတွေကို ဘယ်လိုပြန်ကုဒ်မလဲ။
NA ကို dplyr တွင် Zero ဖြင့် အစားထိုးနည်း
dplyr ကို အသုံးပြု၍ အုပ်စုအလိုက် ကိန်းရှင်များကို စီရန်
dplyr ကိုသုံးပြီး အုပ်စုအလိုက် ပထမအတန်းကို ဘယ်လိုရွေးမလဲ။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။