R တွင် label ကုဒ်လုပ်နည်း (ဥပမာများနှင့်အတူ)


စက်သင်ယူမှုတွင် မကြာခဏဆိုသလို ကျွန်ုပ်တို့သည် အယ်လဂိုရီသမ်များဖြင့် အလွယ်တကူ အသုံးပြုနိုင်သော ဂဏန်းဖော်မတ်အချို့သို့ အမျိုးအစားအလိုက် ကိန်း ရှင်များ ကို ပြောင်းလဲလိုကြသည်။

၎င်းကိုလုပ်ဆောင်ရန်နည်းလမ်းတစ်ခု မှာ အက္ခရာစဉ်အလိုက် အမျိုးအစားအလိုက်တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးတစ်ခုသတ်မှတ်ပေးသည့် အညွှန်းစာဝှက်ကို အသုံးပြုရန်ဖြစ်သည်

ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် Team ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခု၏ တစ်မူထူးခြားသောတန်ဖိုးတစ်ခုစီကို အက္ခရာစဉ်အလိုက် ကိန်းပြည့်တန်ဖိုးသို့ မည်သို့ပြောင်းရမည်ကို ပြသသည်-

R တွင် အညွှန်းကုဒ်လုပ်ရန် ဘုံနည်းလမ်းနှစ်ခုရှိသည်။

နည်းလမ်း 1- Base R ကိုသုံးပါ။

 df$my_var <- as. numeric (factor(df$my_var))

နည်းလမ်း 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြုပါ။

 library (CatEncoders)

#define original categorical labels
labs = LabelEncoder. fit (df$my_var)

#convert labels to numeric values
df$team = transform(labs, df$my_var)

အောက်ဖော်ပြပါ ဥပမာများသည် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- Base R ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း

အောက်ပါကုဒ်သည် အဖွဲ့ ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်အား ကိန်းဂဏန်းကိန်းရှင်အဖြစ်သို့ ပြောင်းလဲရန် R အခြေခံ အချက်() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'),
                 points=c(25, 12, 15, 14, 19, 23, 25, 29))

#view data frame
df

  team points
1 to 25
2 to 12
3 B 15
4 B 14
5 B 19
6 B 23
7 C 25
8 C 29

#perform label encoding on team variable
df$team <- as. numeric (factor(df$team))

#view updated data frame
df

  team points
1 1 25
2 1 12
3 2 15
4 2 14
5 2 19
6 2 23
7 3 25
8 3 29

အဖွဲ့ ကော်လံရှိ တန်ဖိုးအသစ်များကို မှတ်သားပါ-

  • “ A” သည် 1 ဖြစ်လာသည်။
  • “ B” သည် 2 ဖြစ်လာသည်။
  • “ C” သည် 3 ဖြစ်လာသည်။

ကျွန်ုပ်တို့သည် အဖွဲ့ ကော်လံကို အမျိုးအစားခွဲခြားသည့်ကိန်းရှင်မှ ဂဏန်းကိန်းပြောင်းလဲနိုင်သောအဖြစ်သို့ အောင်မြင်စွာပြောင်းလဲလိုက်ပါသည်။

ဥပမာ 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း။

အောက်ပါကုဒ်သည် အဖွဲ့ ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်အား ကိန်းဂဏာန်းပြောင်းလဲမှုတစ်ခုအဖြစ်သို့ ပြောင်းလဲရန် CatEncoders() ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 library (CatEncoders)

#create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'),
                 points=c(25, 12, 15, 14, 19, 23, 25, 29))

#define original categorical labels
labs = LabelEncoder. fit (df$team)

#convert labels to numeric values
df$team = transform(labs, df$team)

#view updated data frame
df

  team points
1 1 25
2 1 12
3 2 15
4 2 14
5 2 19
6 2 23
7 3 25
8 3 29

တစ်ဖန်၊ ကျွန်ုပ်တို့သည် အဖွဲ့ ကော်လံတွင် အောက်ပါတန်ဖိုးအသစ်များကို ထုတ်ပေးသည်-

  • “ A” သည် 1 ဖြစ်လာသည်။
  • “ B” သည် 2 ဖြစ်လာသည်။
  • “ C” သည် 3 ဖြစ်လာသည်။

၎င်းသည် ယခင်နမူနာ၏ ရလဒ်များနှင့် ကိုက်ညီပါသည်။

ဤနည်းလမ်းကို အသုံးပြု၍ အဖွဲ့ ကော်လံ၏ မူရင်းတန်ဖိုးများကို ရယူရန် inverse.transform() ကို အသုံးပြုနိုင်သည်။

 #display original team labels
reverse. transform (labs, df$team)

[1] “A” “A” “B” “B” “B” “B” “C” “C”

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် ဆက်ရန်မှ categorical variable တစ်ခုကို ဖန်တီးနည်း
R တွင် categorical variable များကိုဖန်တီးနည်း
categorical variable များကို R တွင် ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်