Dplyr တွင် ntile() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံ (ဥပမာများနှင့်အတူ)


input vector တစ်ခုကို n bins များအဖြစ် ပိုင်းခြားရန် R ရှိ dplyr package မှ ntile() function ကို အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

ntile(x၊ n)

ရွှေ-

  • x : ထည့်သွင်းသည့် vector
  • n : အခန်းအရေအတွက်

မှတ်ချက် – ပုံးအရွယ်အစားများသည် တစ်ခုနှင့်တစ်ခုအထိ ကွဲပြားနိုင်ပါသည်။

အောက်ဖော်ပြပါ ဥပမာများသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- vector တစ်ခုဖြင့် ntile() ကိုသုံးပါ။

အောက်ပါကုဒ်သည် အစိတ်အပိုင်း 11 ခု၏ vector ကို မတူညီသော ပုံး 5 ခုအဖြစ် ပိုင်းခြားရန် ntile() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-

 library (dplyr)

#createvector
x <- c(1, 3, 4, 6, 7, 8, 10, 13, 19, 22, 23)

#break up vector into 5 buckets
ntile(x, 5)

 [1] 1 1 1 2 2 3 3 4 4 5 5

ရလဒ်မှ၊ မူရင်း vector ၏ ဒြပ်စင်တစ်ခုစီကို ပုံးငါးပုံးထဲမှ တစ်ခုစီတွင် ထည့်ထားသည်ကို တွေ့နိုင်သည်။

အသေးငယ်ဆုံးတန်ဖိုးများကို bucket 1 တွင်သတ်မှတ်ထားပြီး အကြီးဆုံးတန်ဖိုးများကို bucket 5 တွင်သတ်မှတ်ထားသည်။

ဥပမာအားဖြင့်:

  • 1၊ 3 နှင့် 4 ၏ အသေးငယ်ဆုံးတန်ဖိုးများကို ပုံး 1 တွင် သတ်မှတ်ထားသည်။
  • အကြီးဆုံးတန်ဖိုးများ 22 နှင့် 23 ကို bucket 5 တွင်သတ်မှတ်ထားသည်။

ဥပမာ 2- ဒေတာဘောင်ဖြင့် ntile() ကိုအသုံးပြုခြင်း။

မတူညီသော ဘတ်စကက်ဘောကစားသမားများမှ ရမှတ်များကိုပြသသည့် R တွင် အောက်ပါဒေတာဘောင်ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (player=LETTERS[1:9],
                 points=c(12, 19, 7, 22, 24, 28, 30, 19, 15))

#view data frame
df

  player points
1 to 12
2 B 19
3 C 7
4 D 22
5 E 24
6 F 28
7 G 30
8:19 a.m.
9 I 15

ရမှတ်များပေါ်မူတည်၍ ကစားသမားတစ်ဦးစီကို ပုံးပုံးသုံးခုအနက်တစ်ခုသို့ သတ်မှတ်ပေးသည့် ဒေတာဘောင်အတွင်း ကော်လံအသစ်တစ်ခုဖန်တီးရန် ntile() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ဖော်ပြသည်-

 library (dplyr)

#create new column that assigns players into buckets based on points
df$bucket <- ntile(df$points, 3)

#view updated data frame
df

  player points bucket
1 to 12 1
2 B 19 2
3 C 7 1
4 D 22 2
5 E 24 3
6 F 28 3
7 G 30 3
8:19 2
9 I 15 1

ပုံး ကော်လံအသစ်သည် ကစားသမားတစ်ဦးစီအား 1 နှင့် 3 ကြားတန်ဖိုးတစ်ခုသတ်မှတ်ပေးသည်။

အနိမ့်ဆုံးရမှတ်ရှိသောကစားသမားများသည် 1 မှတ် တန်ဖိုးရရှိပြီး အမှတ်အများဆုံးရရှိသည့်ကစားသမားများသည် 3 တန်ဖိုးရရှိမည်ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ရှင်းပြထားပါသည်။

dplyr တွင် cross() function ကိုအသုံးပြုနည်း
dplyr တွင် relocate() function ကိုအသုံးပြုနည်း
dplyr တွင် slice() လုပ်ဆောင်ချက်ကိုအသုံးပြုနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်