R တွင် ဆက်ရန်မှ categorical variable တစ်ခုကို ဖန်တီးနည်း


စဉ်ဆက်မပြတ် variable တစ်ခုမှ categorical variable တစ်ခုကို ဖန်တီးရန် R တွင် cut() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါအခြေခံ syntax ကိုအသုံးပြုသည်-

 df$cat_variable <- cut(df$continuous_variable,
                       breaks=c(5, 10, 15, 20, 25),
                       labels=c(' A ', ' B ', ' C ', ' D '))

ခွဲခြမ်းများသည် စဉ်ဆက်မပြတ်ကိန်းရှင်ကို ပိုင်းခြားရန် တန်ဖိုးများကို သတ်မှတ်ပေးပြီး အညွှန်းများသည် အမျိုးအစားခွဲကိန်းရှင်အသစ်၏ တန်ဖိုးများကို ပေးရန်အတွက် အညွှန်းများကို သတ်မှတ်ပေးသည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- R အတွင်းရှိ သန္တာန်မှ အမျိုးအစားအလိုက် ကိန်းရှင်တစ်ခုကို ဖန်တီးခြင်း။

R တွင် အောက်ပါ data frame ရှိသည်ဆိုပါစို့။

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(78, 82, 86, 94, 99, 104, 109, 110))

#view data frame
df

  team points
1 To 78
2 B 82
3 C 86
4 D 94
5 E 99
6 F 104
7 G 109
8:11 a.m.

လောလောဆယ်တွင် အမှတ်များသည် စဉ်ဆက်မပြတ် ပြောင်းလဲနိုင်သော ပုံစံဖြစ်သည်။

၎င်းကို categorical variable အဖြစ်ဖြတ်ရန် cut() function ကိုသုံးနိုင်သည်။

 #add new column that cuts 'points' into categories
df$cat <- cut(df$points,
              breaks=c(70, 80, 90, 100, 110),
              labels=c('Bad', 'OK', 'Good', 'Great'))

#view updated data frame
df

  team points cat
1 To 78 Bad
2 B 82 OK
3 C 86 OK
4 D 94 Good
5 E 99 Good
6 F 104 Great
7 G 109 Great
8:110 Great

အဖွဲ့တစ်ဖွဲ့ချင်းစီကို ဒေတာ ဘောင် တွင် မကောင်း၊ OK၊ Good သို့မဟုတ် Excellent အဖြစ် အဆင့်သတ်မှတ်ပေးသည့် cat ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့် variable အသစ်တစ်ခုကို ဖန်တီးလိုက်ပါသည်။

ဤ variable အသစ်၏ class ကိုစစ်ဆေးရန် class() function ကိုသုံးနိုင်သည်။

 #check class of 'cat' column
class(df$cat)

[1] “factor”

ပြောင်းလဲနိုင်သော ကြောင် သည် အချက်တစ်ခုဖြစ်ကြောင်း ကျွန်ုပ်တို့မြင်သည်။

cat variable အတွင်းရှိ အမျိုးအစားတစ်ခုစီ၏ ဖြစ်ပျက်မှုများကို ရေတွက်ရန် table() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။

 #count occurrences of each category in 'cat' variable
table(df$cat)
  Bad OK Good Great 
    1 2 2 3

cut() လုပ်ဆောင်ချက်အတွက် အညွှန်း အငြင်းအခုံတစ်ခုကို မပေးပါက၊ R သည် အကွာအဝေး၏ တန်ဖိုးများကို အညွှန်းများအဖြစ် အသုံးပြုလိမ့်မည်-

 #add new column that cuts 'points' into categories
df$cat <- cut(df$points, breaks=c(70, 80, 90, 100, 110))

#view updated data frame
df

  team points cat
1 A 78 (70.80]
2 B 82 (80.90]
3 C 86 (80.90]
4 D 94 (90,100]
5 E 99 (90,100]
6 F 104 (100,110]
7 G 109 (100,110]
8:110 (100,110]

အချို့ကိစ္စများတွင် သင်သည် စိတ်ကြိုက်တံဆိပ်များကို အသုံးပြုရန် ၎င်းကို နှစ်သက်နိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

categorical variable များကို R တွင် ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။
R တွင် categorical variable များကိုဖန်တီးနည်း
R တွင် categorical data ကို ဘယ်လိုဆွဲမလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်