R တွင် one-hot encoding လုပ်နည်း


One-hot encoding ကို machine learning algorithms မှ အသုံးပြုနိုင်သော အမျိုးအစားသို့ အမျိုးအစားပြောင်းရန် အသုံးပြုသည်။

one-hot coding ၏ အခြေခံအယူအဆမှာ 0 နှင့် 1 တန်ဖိုးများကို မူရင်းအမျိုးအစားတန်ဖိုးများကိုကိုယ်စားပြုရန်အတွက် variable အသစ်များကိုဖန်တီးရန်ဖြစ်သည်။

ဥပမာအားဖြင့်၊ အောက်ပါပုံသည် 0 နှင့် 1 တန်ဖိုးများသာရှိသော အမျိုးအစားအသစ်များပါရှိသော အဖွဲ့အမည်များပါရှိသော အမျိုးအစားကွဲပြားသော variable တစ်ခုကို ပြောင်းလဲရန်အတွက် ကျွန်ုပ်တို့သည် one-hot ကုဒ်နံပါတ်ကို မည်သို့ပြသထားသည်ကို ပြသသည်-

အောက်ဖော်ပြပါ အဆင့်ဆင့် ဥပမာသည် R တွင် ဤအတိအကျဒေတာအတွဲအတွက် တစ်ကြိမ်တည်းကုဒ်လုပ်နည်းကို ပြသထားသည်။

အဆင့် 1: ဒေတာကိုဖန်တီးပါ။

အရင်ဆုံး R မှာ အောက်ပါ data frame ကို ဖန်တီးကြည့်ရအောင်။

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'),
                 points=c(25, 12, 15, 14, 19, 23, 25, 29))

#view data frame
df

  team points
1 to 25
2 to 12
3 B 15
4 B 14
5 B 19
6 B 23
7 C 25
8 C 29

အဆင့် 2- one-hot encoding ကို လုပ်ဆောင်ပါ။

ထို့နောက်၊ data frame ရှိ ‘team’ variable ကို hot one-hot encode လုပ်ရန်အတွက် caret package ၏ dummyVars() function ကိုသုံးကြပါစို့။

 library ( caret)

#define one-hot encoding function
dummy <- dummyVars(" ~ . ", data=df)

#perform one-hot encoding on data frame
final_df <- data. frame (predict(dummy, newdata=df))

#view final data frame
final_df

  teamA teamB teamC points
1 1 0 0 25
2 1 0 0 12
3 0 1 0 15
4 0 1 0 14
5 0 1 0 19
6 0 1 0 23
7 0 0 1 25
8 0 0 1 29

မူရင်း “ အဖွဲ့” ကော်လံတွင် ထူးခြားသောတန်ဖိုး သုံးခုပါရှိသောကြောင့် ကော်လံအသစ်သုံးခုကို ဒေတာဘောင်သို့ ပေါင်းထည့်ခဲ့ကြောင်း သတိပြုပါ။

မူရင်း “ အဖွဲ့” ကော်လံကို မလိုအပ်တော့သဖြင့် ဒေတာဘောင်မှ ဖယ်ရှားလိုက်ကြောင်းကိုလည်း သတိပြုပါ။

တစ်ခုတည်းသော ကုဒ်နံပါတ်သည် ပြီးပြည့်စုံပြီး ယခု ကျွန်ုပ်တို့ရွေးချယ်သည့် မည်သည့် စက်သင်ယူမှု အယ်လဂိုရီသမ်တွင် ဤဒေတာအတွဲကို ကျွေးမွေးနိုင်ပါပြီ။

မှတ်ချက်dummyVars() လုပ်ဆောင်ချက်အတွက် အွန်လိုင်းစာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် သင်ရှာဖွေနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် အမျိုးအစားအလိုက် ကိန်းရှင်များကို အသုံးပြုခြင်းဆိုင်ရာ နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-

R တွင် categorical variable များကိုဖန်တီးနည်း
R တွင် categorical data ကို ဘယ်လိုဆွဲမလဲ။
အမျိုးအစားအလိုက် သို့မဟုတ် အရေအတွက် ကိန်းရှင်များ- ကွာခြားချက်ကား အဘယ်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်