Dplyr ကို အသုံးပြု၍ အုပ်စုအလိုက် ကိန်းရှင်များကို စီရန်


သင်သည် dplyr တွင် variable များကို အုပ်စုဖွဲ့ရန်အတွက် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။

 df %>% arrange (group_var, numeric_var) %>%
    group_by (group_var) %>% 
    mutate (rank = rank(numeric_var))

အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #create data frame
df <- data. frame (team = c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#view data frame
df

   team points rebounds
1 to 12 5
2 to 28 7
3 to 19 7
4 A 22 12
5 B 32 11
6 B 45 4
7 B 22 10
8 C 28 7
9 C 13 8
10 C 19 8

ဥပမာ 1- ကြီးလိုက်ကြီးလိုက် အဆင့်လိုက်

အောက်ပါကုဒ်သည် အသင်းအလိုက် အုပ်စုဖွဲ့ထားသော ကစားသမားများမှ ရမှတ်များကို ငယ်စဉ်ကြီးလိုက်ဖြင့် စီရန်ပုံကို ပြသသည်-

 library (dplyr)

#rank points scored, grouped by team
df %>% arrange (team, points) %>%
    group_by (team) %>% 
    mutate (rank = rank(points))

# A tibble: 10 x 4
# Groups: team [3]
   team points rebounds rank
          
 1 A 12 5 1
 2 A 19 7 2
 3 A 22 12 3
 4 A 28 7 4
 5 B 22 10 1
 6 B 32 11 2
 7 B 45 4 3
 8 C 13 8 1
 9 C 19 8 2
10 C 28 7 3

ဥပမာ 2- အဆင့် ကြီးစဉ်ငယ်လိုက်

Rank() လုပ်ဆောင်ချက်အတွင်း အနုတ်လက္ခဏာသင်္ကေတကို အသုံးပြု၍ အုပ်စုအလိုက် ကြီးစဉ်ငယ်လိုက် ရမှတ်များကို ခွဲခြားနိုင်သည်-

 library (dplyr)

#rank points scored in reverse, grouped by team
df %>% arrange (team, points) %>%
    group_by (team) %>% 
    mutate (rank = rank(-points))

# A tibble: 10 x 4
# Groups: team [3]
   team points rebounds rank
          
 1 to 12 5 4
 2 A 19 7 3
 3 A 22 12 2
 4 A 28 7 1
 5 B 22 10 3
 6 B 32 11 2
 7 B 45 4 1
 8 C 13 8 3
 9 C 19 8 2
10 C 28 7 1

အဆင့်သတ်မှတ်ချက်တွင် ဆက်ဆံရေးကို မည်သို့ကိုင်တွယ်မည်နည်း။

ကိန်းဂဏာန်းတန်ဖိုးများကို စီစဥ်ရာတွင် ကျွန်ုပ်တို့ မည်သို့ကိုင်တွယ်သင့်သည်ကို သတ်မှတ်ရန် tie.method argument ကို အသုံးပြုနိုင်ပါသည်။

 rank(points, ties. method = ' average ')

လင့်ခ်များကို ကိုင်တွယ်နည်းကို သတ်မှတ်ရန် အောက်ပါရွေးချယ်စရာများထဲမှ တစ်ခုကို သင်အသုံးပြုနိုင်သည်-

  • ပျမ်းမျှ : (ပုံသေ) ချိတ်ဆက်ထားသော အရာတစ်ခုစီကို ပျမ်းမျှအဆင့်ကို ပေးသည် (အဆင့် 3 နှင့် အဆင့် 4 နှစ်ခုစလုံးသည် အဆင့် 3.5 ရရှိသည်)
  • ပထမ : အနိမ့်ဆုံးအဆင့်သို့ ပထမဆုံးချိတ်ဆက်ထားသောဒြပ်စင်အား သတ်မှတ်ပေးသည် (အဆင့် 3 နှင့် 4 အဆင့်ရှိ အစိတ်အပိုင်းများကို အဆင့် 3 နှင့် 4 အသီးသီးရရှိပါမည်)
  • မိနစ် – လင့်ခ်တစ်ခုစီကို အနိမ့်ဆုံးအဆင့်သို့ သတ်မှတ်ပေးသည် (အဆင့် 3 နှင့် အဆင့် 4 နှစ်ခုစလုံးသည် အဆင့် 3 ရရှိမည်)
  • အမြင့်ဆုံး – လင့်ခ်ချိတ်ထားသော အရာတစ်ခုစီကို အမြင့်ဆုံးအဆင့် သတ်မှတ်ပေးသည် (အဆင့် 3 နှင့် အဆင့် 4 နှစ်ခုစလုံးသည် အဆင့် 4 ရရှိမည်)
  • Random : ချိတ်ထားသောဒြပ်စင်တစ်ခုစီကို ကျပန်းအဆင့်တစ်ခုစီသတ်မှတ်ပေးသည် ( 3rd နှင့် 4th ရာထူးအတွက် ချိတ်ထားသောဒြပ်စင်များကို rank တစ်ခုခုရနိုင်သည်)

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

dplyr ကိုသုံးပြီး အုပ်စုအလိုက် ပထမအတန်းကို ဘယ်လိုရွေးမလဲ။
dplyr ကို အသုံးပြု၍ နှိုင်းရကြိမ်နှုန်းများကို တွက်ချက်နည်း
dplyr ကိုသုံးပြီး တန်ဖိုးတွေကို ဘယ်လိုပြန်ကုဒ်မလဲ။
NA ကို dplyr တွင် Zero ဖြင့် အစားထိုးနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်