R တွင် label ကုဒ်လုပ်နည်း (ဥပမာများနှင့်အတူ)
စက်သင်ယူမှုတွင် မကြာခဏဆိုသလို ကျွန်ုပ်တို့သည် အယ်လဂိုရီသမ်များဖြင့် အလွယ်တကူ အသုံးပြုနိုင်သော ဂဏန်းဖော်မတ်အချို့သို့ အမျိုးအစားအလိုက် ကိန်း ရှင်များ ကို ပြောင်းလဲလိုကြသည်။
၎င်းကိုလုပ်ဆောင်ရန်နည်းလမ်းတစ်ခု မှာ အက္ခရာစဉ်အလိုက် အမျိုးအစားအလိုက်တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးတစ်ခုသတ်မှတ်ပေးသည့် အညွှန်းစာဝှက်ကို အသုံးပြုရန်ဖြစ်သည် ။
ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် Team ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခု၏ တစ်မူထူးခြားသောတန်ဖိုးတစ်ခုစီကို အက္ခရာစဉ်အလိုက် ကိန်းပြည့်တန်ဖိုးသို့ မည်သို့ပြောင်းရမည်ကို ပြသသည်-
R တွင် အညွှန်းကုဒ်လုပ်ရန် ဘုံနည်းလမ်းနှစ်ခုရှိသည်။
နည်းလမ်း 1- Base R ကိုသုံးပါ။
df$my_var <- as. numeric (factor(df$my_var))
နည်းလမ်း 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြုပါ။
library (CatEncoders) #define original categorical labels labs = LabelEncoder. fit (df$my_var) #convert labels to numeric values df$team = transform(labs, df$my_var)
အောက်ဖော်ပြပါ ဥပမာများသည် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ 1- Base R ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း
အောက်ပါကုဒ်သည် အဖွဲ့ ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်အား ကိန်းဂဏန်းကိန်းရှင်အဖြစ်သို့ ပြောင်းလဲရန် R အခြေခံ အချက်() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'), points=c(25, 12, 15, 14, 19, 23, 25, 29)) #view data frame df team points 1 to 25 2 to 12 3 B 15 4 B 14 5 B 19 6 B 23 7 C 25 8 C 29 #perform label encoding on team variable df$team <- as. numeric (factor(df$team)) #view updated data frame df team points 1 1 25 2 1 12 3 2 15 4 2 14 5 2 19 6 2 23 7 3 25 8 3 29
အဖွဲ့ ကော်လံရှိ တန်ဖိုးအသစ်များကို မှတ်သားပါ-
- “ A” သည် 1 ဖြစ်လာသည်။
- “ B” သည် 2 ဖြစ်လာသည်။
- “ C” သည် 3 ဖြစ်လာသည်။
ကျွန်ုပ်တို့သည် အဖွဲ့ ကော်လံကို အမျိုးအစားခွဲခြားသည့်ကိန်းရှင်မှ ဂဏန်းကိန်းပြောင်းလဲနိုင်သောအဖြစ်သို့ အောင်မြင်စွာပြောင်းလဲလိုက်ပါသည်။
ဥပမာ 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း။
အောက်ပါကုဒ်သည် အဖွဲ့ ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်အား ကိန်းဂဏာန်းပြောင်းလဲမှုတစ်ခုအဖြစ်သို့ ပြောင်းလဲရန် CatEncoders() ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-
library (CatEncoders) #create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'), points=c(25, 12, 15, 14, 19, 23, 25, 29)) #define original categorical labels labs = LabelEncoder. fit (df$team) #convert labels to numeric values df$team = transform(labs, df$team) #view updated data frame df team points 1 1 25 2 1 12 3 2 15 4 2 14 5 2 19 6 2 23 7 3 25 8 3 29
တစ်ဖန်၊ ကျွန်ုပ်တို့သည် အဖွဲ့ ကော်လံတွင် အောက်ပါတန်ဖိုးအသစ်များကို ထုတ်ပေးသည်-
- “ A” သည် 1 ဖြစ်လာသည်။
- “ B” သည် 2 ဖြစ်လာသည်။
- “ C” သည် 3 ဖြစ်လာသည်။
၎င်းသည် ယခင်နမူနာ၏ ရလဒ်များနှင့် ကိုက်ညီပါသည်။
ဤနည်းလမ်းကို အသုံးပြု၍ အဖွဲ့ ကော်လံ၏ မူရင်းတန်ဖိုးများကို ရယူရန် inverse.transform() ကို အသုံးပြုနိုင်သည်။
#display original team labels reverse. transform (labs, df$team) [1] “A” “A” “B” “B” “B” “B” “C” “C”
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
R တွင် ဆက်ရန်မှ categorical variable တစ်ခုကို ဖန်တီးနည်း
R တွင် categorical variable များကိုဖန်တီးနည်း
categorical variable များကို R တွင် ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။