R တွင် one-hot encoding လုပ်နည်း
One-hot encoding ကို machine learning algorithms မှ အသုံးပြုနိုင်သော အမျိုးအစားသို့ အမျိုးအစားပြောင်းရန် အသုံးပြုသည်။
one-hot coding ၏ အခြေခံအယူအဆမှာ 0 နှင့် 1 တန်ဖိုးများကို မူရင်းအမျိုးအစားတန်ဖိုးများကိုကိုယ်စားပြုရန်အတွက် variable အသစ်များကိုဖန်တီးရန်ဖြစ်သည်။
ဥပမာအားဖြင့်၊ အောက်ပါပုံသည် 0 နှင့် 1 တန်ဖိုးများသာရှိသော အမျိုးအစားအသစ်များပါရှိသော အဖွဲ့အမည်များပါရှိသော အမျိုးအစားကွဲပြားသော variable တစ်ခုကို ပြောင်းလဲရန်အတွက် ကျွန်ုပ်တို့သည် one-hot ကုဒ်နံပါတ်ကို မည်သို့ပြသထားသည်ကို ပြသသည်-

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် R တွင် ဤအတိအကျဒေတာအတွဲအတွက် တစ်ကြိမ်တည်းကုဒ်လုပ်နည်းကို ပြသထားသည်။
အဆင့် 1: ဒေတာကိုဖန်တီးပါ။
အရင်ဆုံး R မှာ အောက်ပါ data frame ကို ဖန်တီးကြည့်ရအောင်။
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'), points=c(25, 12, 15, 14, 19, 23, 25, 29)) #view data frame df team points 1 to 25 2 to 12 3 B 15 4 B 14 5 B 19 6 B 23 7 C 25 8 C 29
အဆင့် 2- one-hot encoding ကို လုပ်ဆောင်ပါ။
ထို့နောက်၊ data frame ရှိ ‘team’ variable ကို hot one-hot encode လုပ်ရန်အတွက် caret package ၏ dummyVars() function ကိုသုံးကြပါစို့။
library ( caret) #define one-hot encoding function dummy <- dummyVars(" ~ . ", data=df) #perform one-hot encoding on data frame final_df <- data. frame (predict(dummy, newdata=df)) #view final data frame final_df teamA teamB teamC points 1 1 0 0 25 2 1 0 0 12 3 0 1 0 15 4 0 1 0 14 5 0 1 0 19 6 0 1 0 23 7 0 0 1 25 8 0 0 1 29
မူရင်း “ အဖွဲ့” ကော်လံတွင် ထူးခြားသောတန်ဖိုး သုံးခုပါရှိသောကြောင့် ကော်လံအသစ်သုံးခုကို ဒေတာဘောင်သို့ ပေါင်းထည့်ခဲ့ကြောင်း သတိပြုပါ။
မူရင်း “ အဖွဲ့” ကော်လံကို မလိုအပ်တော့သဖြင့် ဒေတာဘောင်မှ ဖယ်ရှားလိုက်ကြောင်းကိုလည်း သတိပြုပါ။
တစ်ခုတည်းသော ကုဒ်နံပါတ်သည် ပြီးပြည့်စုံပြီး ယခု ကျွန်ုပ်တို့ရွေးချယ်သည့် မည်သည့် စက်သင်ယူမှု အယ်လဂိုရီသမ်တွင် ဤဒေတာအတွဲကို ကျွေးမွေးနိုင်ပါပြီ။
မှတ်ချက် – dummyVars() လုပ်ဆောင်ချက်အတွက် အွန်လိုင်းစာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် သင်ရှာဖွေနိုင်ပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အမျိုးအစားအလိုက် ကိန်းရှင်များကို အသုံးပြုခြင်းဆိုင်ရာ နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
R တွင် categorical variable များကိုဖန်တီးနည်း
R တွင် categorical data ကို ဘယ်လိုဆွဲမလဲ။
အမျိုးအစားအလိုက် သို့မဟုတ် အရေအတွက် ကိန်းရှင်များ- ကွာခြားချက်ကား အဘယ်နည်း။