R တွင် cut() function ကိုအသုံးပြုနည်း


R ရှိ cut() လုပ်ဆောင်ချက်သည် တန်ဖိုးများစွာကို ဘင်များထဲသို့ ဖြတ်ကာ ဘင်တစ်ခုစီအတွက် အညွှန်းများကို သတ်မှတ်ရန် အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-

cut(x၊ breaks၊ labels = NULL၊ …)

ရွှေ-

  • x : Vector အမည်
  • breaks : ပြုလုပ်ရန် အနားယူမှု အရေအတွက် သို့မဟုတ် ခွဲမှတ်များ၏ vector
  • တံဆိပ်များ : ရလဒ် bins များအတွက် အညွှန်းများ

အောက်ပါဥပမာများသည် R ရှိ ဒေတာဘောင်ဖြင့် မတူညီသောအခြေအနေများတွင် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'),
                 points=c(4, 7, 8, 12, 14, 16, 20, 26, 36))

#view data frame
df

  player points
1 to 4
2 B 7
3 C 8
4 D 12
5 E 14
6 F 16
7 G 20
8:26 a.m.
9 I 36

ဥပမာ 1- အခွဲအရေအတွက်ပေါ်မူတည်၍ vector ကိုဖြတ်ပါ။

အောက်ဖော်ပြပါ ကုဒ်သည် အမှတ်များကို အရွယ်အစား လေးမျိုးရှိသော အုပ်စုများအဖြစ် ဖြတ်သည့် ကော်လံဟုခေါ်သော အမျိုးအစား ကော်လံအသစ်ကို ဖန်တီးရန် cut() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 #create new column that places each player into four categories based on points
df$category <- cut(df$points, breaks= 4 )

#view updated data frame
df

  player points category
1 to 4 (3.97.12]
2 B 7 (3.97.12]
3 C 8 (3.97.12]
4 D 12 (3.97.12]
5 E 14 (12.20]
6 F 16 (12.20]
7 G 20 (12.20]
8:26 a.m. (20.28]
9 I 36 (28.36]

breaks=4 ကို ကျွန်ုပ်တို့သတ်မှတ်ထားသောကြောင့် cut() function သည် point column ရှိတန်ဖိုးများကိုတန်းတူအရွယ်အစားလေးမျိုးရှိသောအုပ်စုများအဖြစ်ခွဲသည်။

ဤသည်မှာ cut() function သည် ၎င်းကို မည်သို့လုပ်ဆောင်ခဲ့သည် ။

  • ဦးစွာ၊ သူသည် အမှတ်များကော်လံ (36 – 4 = 32) ရှိ အကြီးဆုံးနှင့် အသေးငယ်ဆုံးတန်ဖိုးများအကြား ကွာခြားချက်ကို တွေ့ရှိခဲ့သည်။
  • ထို့နောက် ဤခြားနားချက်ကို ၄ (၃၂/၄=၈) ဖြင့် ပိုင်းခြားပြီး၊
  • ရလဒ်မှာ တစ်ခုလျှင် 8 အကျယ်ရှိသော bins လေးခုဖြစ်သည်။

မှတ်ချက်cut() documentation မှ အောက်ပါ လုပ်ဆောင်နိုင်စွမ်းကြောင့် 4 အစား အနိမ့်ဆုံး ကြားကာလသည် 3.97 ဖြစ်သည်။

ခေတ္တရပ်နားခြင်းကို နံပါတ်တစ်ခုတည်းအဖြစ် သတ်မှတ်သောအခါ၊ ဒေတာအကွာအဝေးကို ခေတ္တနားချိန်အတိုအထွာများအဖြစ် ပိုင်းခြားထားပြီး၊ ခေတ္တနားချိန်များတွင် အကွာအဝေးနှစ်ခုလုံးအတွင်း ကျရောက်ကြောင်း သေချာစေရန်အတွက် ပြင်ပကန့်သတ်ချက်များကို အပိုင်းအခြားမှ 0.1% ဝေးရာသို့ ရွှေ့ထားသည်။

ဥပမာ 2- သီးခြားခွဲမှတ်များပေါ်အခြေခံ၍ vector ကိုဖြတ်တောက်ခြင်း။

အောက်ဖော်ပြပါ ကုဒ်သည် သတ်မှတ်ထားသော ခွဲထွက်မှတ်များ၏ vector ကို အခြေခံ၍ အမှတ်များ ကော်လံကို ဖြတ်သည့် အမျိုးအစား ဟုခေါ်သော ကော်လံအသစ်ကို ဖန်တီးရန် cut() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-

 #create new column based on specific break points
df$category <- cut(df$points, breaks=c(0, 10, 15, 20, 40))

#view updated data frame
df

  player points category
1 to 4 (0.10]
2 B 7 (0.10]
3 C 8 (0.10]
4 D 12 (10.15]
5 E 14 (10.15]
6 F 16 (15.20]
7 G 20 (15.20]
8:26 a.m. (20.40)
9 I 36 (20.40]

cut() လုပ်ဆောင်ချက်သည် ကျွန်ုပ်တို့ပေးထားသော breakpoints ၏ သီးခြား vector ကို အခြေခံ၍ ကစားသမားတစ်ဦးစီကို အမျိုးအစားများ ခွဲခြားထားသည်။

ဥပမာ 3- တိကျသော Breakpoints နှင့် Labels ကိုအသုံးပြု၍ Vector တစ်ခုကိုဖြတ်ပါ။

အောက်ပါကုဒ်သည် စိတ်ကြိုက်တံဆိပ်များပါသည့် သီးခြားအမှတ်အသားများရှိသော ကွက်လပ်တစ်ခု၏ vector ကိုအခြေခံ၍ အမှတ်များ ကော်လံကိုဖြတ်သည့် အမျိုးအစား ဟုခေါ်သော ကော်လံအသစ်တစ်ခုဖန်တီးရန် cut() လုပ်ဆောင်ချက်ကို အသုံးပြုပုံကို ပြသသည်-

 #create new column based on values in points column
df$category <- cut(df$points,
                   breaks=c(0, 10, 15, 20, 40),
                   labels=c(' Bad ', ' OK ', ' Good ', ' Great '))

#view updated data frame
df

  player points category
1 A 4 Bad
2 B 7 Bad
3 C 8 Bad
4 D 12 OK
5 E 14 OK
6 F 16 Good
7 G 20 Good
8:26 A.M. Great
9 I 36 Great

အမျိုးအစား ကော်လံအသစ်သည် ကစားသမားတစ်ဦးစီကို အမှတ်များ ကော်လံရှိ သက်ဆိုင်ရာတန်ဖိုးအပေါ် အခြေခံ၍ ဆိုး၊ အိုကေ၊ ကောင်း သို့မဟုတ် ထူးချွန်အဖြစ် အဆင့်သတ်မှတ်သည်။

မှတ်ချက် – အောက်ပါအမှားအယွင်းများကို ရှောင်ရှားရန် အညွှန်းအရေအတွက်သည် အမြဲတမ်းတစ်ခုဖြစ်နေရမည်ဖြစ်ပြီး၊

 Error in cut.default(df$points, breaks = c(0, 10, 15, 20, 40), labels = c("Bad",: 
  lengths of 'breaks' and 'labels' differ

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံလုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ရှင်းပြထားပါသည်။

R တွင် tabulate() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။
R တွင် split() function ကိုအသုံးပြုနည်း
R တွင် match() function ကိုအသုံးပြုနည်း
R တွင် replicate() function ကိုအသုံးပြုနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်