R တွင် ဒေတာအုပ်စုဖွဲ့နည်း- ဥပမာများဖြင့် လုပ်ဆောင်ပုံ


R တွင် ဒေတာအုပ်စုဖွဲ့ခြင်းကို လုပ်ဆောင်ရန် နည်းလမ်းနှစ်ခုထဲမှ တစ်ခုကို သင်အသုံးပြုနိုင်သည်-

နည်းလမ်း 1- cut() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။

 library (dplyr)

#perform binning with custom breaks
df %>% mutate(new_bin = cut(variable_name, breaks=c(0, 10, 20, 30)))

#perform binning with specific number of bins
df %>% mutate(new_bin = cut(variable_name, breaks= 3 ))

နည်းလမ်း 2- ntile() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။

 library (dplyr)

#perform binning with specific number of bins
df %>% mutate(new_bin = ntile(variable_name, n= 3 ))

အောက်ပါဥပမာများသည် အောက်ပါဒေတာဘောင်ဖြင့် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးပြုနည်းကို ပြသသည်-

 #create data frame
df <- data. frame (points=c(4, 4, 7, 8, 12, 13, 15, 18, 22, 23, 23, 25),
                 assists=c(2, 5, 4, 7, 7, 8, 5, 4, 5, 11, 13, 8),
                 rebounds=c(7, 7, 4, 6, 3, 8, 9, 9, 12, 11, 8, 9))

#view head of data frame
head(df)

  points assists rebounds
1 4 2 7
2 4 5 7
3 7 4 4
4 8 7 6
5 12 7 3
6 13 8 8

ဥပမာ 1- cut() လုပ်ဆောင်ချက်ဖြင့် ဒေတာအုပ်စုဖွဲ့ခြင်းကို လုပ်ဆောင်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် သီးခြားအမှတ်အသားများဖြင့် cut() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ ကိန်းရှင် တွင် ဒေတာအုပ်စုဖွဲ့နည်းကို ပြသသည်-

 library (dplyr)

#perform data binning on variable points
df %>% mutate(points_bin = cut(points, breaks=c(0, 10, 20, 30)))

   points assists rebounds points_bin
1 4 2 7 (0.10]
2 4 5 7 (0.10]
3 7 4 4 (0.10]
4 8 7 6 (0.10]
5 12 7 3 (10.20]
6 13 8 8 (10.20]
7 15 5 9 (10.20]
8 18 4 9 (10.20]
9 22 5 12 (20.30]
10 23 11 11 (20.30]
11 23 13 8 (20.30]
12 25 8 9 (20.30]

ဒေတာဘောင်ရှိ အတန်းတစ်ခုစီကို အမှတ်ကော်လံ၏တန်ဖိုးပေါ်အခြေခံ၍ အုပ်စုသုံးစုအနက်တစ်ခုသို့ ထားရှိထားကြောင်း သတိပြုပါ။

အနိမ့်ဆုံးတန်ဖိုးမှ အမှတ်များ၏ ကော်လံ၏ အမြင့်ဆုံးတန်ဖိုးအထိ တူညီသော အကျယ်အကွက်များကို ဖန်တီးရန်အတွက်လည်း အသုံးပြုရန် jumps အရေအတွက်ကို သတ်မှတ်နိုင်သည်။

 library (dplyr)

#perform data binning on variable points
df %>% mutate(points_bin = cut(points, breaks= 3 ))

   points assists rebounds points_bin
1 4 2 7 (3.98.11]
2 4 5 7 (3.98.11]
3 7 4 4 (3.98.11]
4 8 7 6 (3.98.11]
5 12 7 3 (11.18]
6 13 8 8 (11.18]
7 15 5 9 (11.18]
8 18 4 9 (11.18]
9 22 5 12 (18.25]
10 23 11 11 (18.25]
11 23 13 8 (18.25]
12 25 8 9 (18.25]

ဥပမာ 2- ntile() လုပ်ဆောင်ချက်ဖြင့် ဒေတာအုပ်စုဖွဲ့ခြင်းကို လုပ်ဆောင်ပါ။

အောက်ပါ ကုဒ်သည် ရလဒ်အုပ်စုများ၏ နံပါတ်အလိုက် ကိန်းသေတစ်ခုဖြင့် ntile() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ အချက်များကို ပြောင်းလဲနိုင်သော ကိန်းရှင်တွင် ဒေတာအုပ်စုဖွဲ့နည်းကို ပြသသည်-

 library (dplyr)

#perform data binning on variable points
df %>% mutate(points_bin = ntile(points, n= 3 ))

   points assists rebounds points_bin
1 4 2 7 1
2 4 5 7 1
3 7 4 4 1
4 8 7 6 1
5 12 7 3 2
6 13 8 8 2
7 15 5 9 2
8 18 4 9 2
9 22 5 12 3
10 23 11 11 3
11 23 13 8 3
12 25 8 9 3

အမှတ် ကော်လံတန်ဖိုးအပေါ် အခြေခံ၍ အတန်းတစ်ခုစီကို 1 မှ 3 အထိ အကွက်တစ်ခု သတ်မှတ်ပေးထားကြောင်း သတိပြုပါ။

ဘင်၏အကွာအဝေးကိုညွှန်ပြသည့်ကြားကာလထက် အတန်းတစ်ခုစီတွင် ကိန်းပြည့်တန်ဖိုးကို ပြသလိုသည့်အခါ ntile() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်းသည် အကောင်းဆုံးဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် data frame တွင်တန်ဖိုးများကိုအခြေအနေအတိုင်းအစားထိုးနည်း
R တွင် ဖြတ်တောက်ထားသော ဆိုလိုရင်းကို တွက်နည်း
R တွင် conditional mean တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်