Dplyr ကို အသုံးပြု၍ အုပ်စုအလိုက် ကိန်းရှင်များကို စီရန်
သင်သည် dplyr တွင် variable များကို အုပ်စုဖွဲ့ရန်အတွက် အောက်ပါအခြေခံ syntax ကိုသုံးနိုင်သည်။
df %>% arrange (group_var, numeric_var) %>% group_by (group_var) %>% mutate (rank = rank(numeric_var))
အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
#create data frame df <- data. frame (team = c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'), points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19), rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8)) #view data frame df team points rebounds 1 to 12 5 2 to 28 7 3 to 19 7 4 A 22 12 5 B 32 11 6 B 45 4 7 B 22 10 8 C 28 7 9 C 13 8 10 C 19 8
ဥပမာ 1- ကြီးလိုက်ကြီးလိုက် အဆင့်လိုက်
အောက်ပါကုဒ်သည် အသင်းအလိုက် အုပ်စုဖွဲ့ထားသော ကစားသမားများမှ ရမှတ်များကို ငယ်စဉ်ကြီးလိုက်ဖြင့် စီရန်ပုံကို ပြသသည်-
library (dplyr) #rank points scored, grouped by team df %>% arrange (team, points) %>% group_by (team) %>% mutate (rank = rank(points)) # A tibble: 10 x 4 # Groups: team [3] team points rebounds rank 1 A 12 5 1 2 A 19 7 2 3 A 22 12 3 4 A 28 7 4 5 B 22 10 1 6 B 32 11 2 7 B 45 4 3 8 C 13 8 1 9 C 19 8 2 10 C 28 7 3
ဥပမာ 2- အဆင့် ကြီးစဉ်ငယ်လိုက်
Rank() လုပ်ဆောင်ချက်အတွင်း အနုတ်လက္ခဏာသင်္ကေတကို အသုံးပြု၍ အုပ်စုအလိုက် ကြီးစဉ်ငယ်လိုက် ရမှတ်များကို ခွဲခြားနိုင်သည်-
library (dplyr) #rank points scored in reverse, grouped by team df %>% arrange (team, points) %>% group_by (team) %>% mutate (rank = rank(-points)) # A tibble: 10 x 4 # Groups: team [3] team points rebounds rank 1 to 12 5 4 2 A 19 7 3 3 A 22 12 2 4 A 28 7 1 5 B 22 10 3 6 B 32 11 2 7 B 45 4 1 8 C 13 8 3 9 C 19 8 2 10 C 28 7 1
အဆင့်သတ်မှတ်ချက်တွင် ဆက်ဆံရေးကို မည်သို့ကိုင်တွယ်မည်နည်း။
ကိန်းဂဏာန်းတန်ဖိုးများကို စီစဥ်ရာတွင် ကျွန်ုပ်တို့ မည်သို့ကိုင်တွယ်သင့်သည်ကို သတ်မှတ်ရန် tie.method argument ကို အသုံးပြုနိုင်ပါသည်။
rank(points, ties. method = ' average ')
လင့်ခ်များကို ကိုင်တွယ်နည်းကို သတ်မှတ်ရန် အောက်ပါရွေးချယ်စရာများထဲမှ တစ်ခုကို သင်အသုံးပြုနိုင်သည်-
- ပျမ်းမျှ : (ပုံသေ) ချိတ်ဆက်ထားသော အရာတစ်ခုစီကို ပျမ်းမျှအဆင့်ကို ပေးသည် (အဆင့် 3 နှင့် အဆင့် 4 နှစ်ခုစလုံးသည် အဆင့် 3.5 ရရှိသည်)
- ပထမ : အနိမ့်ဆုံးအဆင့်သို့ ပထမဆုံးချိတ်ဆက်ထားသောဒြပ်စင်အား သတ်မှတ်ပေးသည် (အဆင့် 3 နှင့် 4 အဆင့်ရှိ အစိတ်အပိုင်းများကို အဆင့် 3 နှင့် 4 အသီးသီးရရှိပါမည်)
- မိနစ် – လင့်ခ်တစ်ခုစီကို အနိမ့်ဆုံးအဆင့်သို့ သတ်မှတ်ပေးသည် (အဆင့် 3 နှင့် အဆင့် 4 နှစ်ခုစလုံးသည် အဆင့် 3 ရရှိမည်)
- အမြင့်ဆုံး – လင့်ခ်ချိတ်ထားသော အရာတစ်ခုစီကို အမြင့်ဆုံးအဆင့် သတ်မှတ်ပေးသည် (အဆင့် 3 နှင့် အဆင့် 4 နှစ်ခုစလုံးသည် အဆင့် 4 ရရှိမည်)
- Random : ချိတ်ထားသောဒြပ်စင်တစ်ခုစီကို ကျပန်းအဆင့်တစ်ခုစီသတ်မှတ်ပေးသည် ( 3rd နှင့် 4th ရာထူးအတွက် ချိတ်ထားသောဒြပ်စင်များကို rank တစ်ခုခုရနိုင်သည်)
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် dplyr တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
dplyr ကိုသုံးပြီး အုပ်စုအလိုက် ပထမအတန်းကို ဘယ်လိုရွေးမလဲ။
dplyr ကို အသုံးပြု၍ နှိုင်းရကြိမ်နှုန်းများကို တွက်ချက်နည်း
dplyr ကိုသုံးပြီး တန်ဖိုးတွေကို ဘယ်လိုပြန်ကုဒ်မလဲ။
NA ကို dplyr တွင် Zero ဖြင့် အစားထိုးနည်း