R တွင် label ကုဒ်လုပ်နည်း (ဥပမာများနှင့်အတူ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 17, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

စက်သင်ယူမှုတွင် မကြာခဏဆိုသလို ကျွန်ုပ်တို့သည် အယ်လဂိုရီသမ်များဖြင့် အလွယ်တကူ အသုံးပြုနိုင်သော ဂဏန်းဖော်မတ်အချို့သို့ အမျိုးအစားအလိုက် ကိန်း ရှင်များ ကို ပြောင်းလဲလိုကြသည်။

၎င်းကိုလုပ်ဆောင်ရန်နည်းလမ်းတစ်ခု မှာ အက္ခရာစဉ်အလိုက် အမျိုးအစားအလိုက်တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးတစ်ခုသတ်မှတ်ပေးသည့် အညွှန်းစာဝှက်ကို အသုံးပြုရန်ဖြစ်သည် ။

ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် Team ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခု၏ တစ်မူထူးခြားသောတန်ဖိုးတစ်ခုစီကို အက္ခရာစဉ်အလိုက် ကိန်းပြည့်တန်ဖိုးသို့ မည်သို့ပြောင်းရမည်ကို ပြသသည်-

R တွင် အညွှန်းကုဒ်လုပ်ရန် ဘုံနည်းလမ်းနှစ်ခုရှိသည်။

နည်းလမ်း 1- Base R ကိုသုံးပါ။

 df$my_var <- as. numeric (factor(df$my_var))

နည်းလမ်း 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြုပါ။

 library (CatEncoders)

#define original categorical labels
labs = LabelEncoder. fit (df$my_var)

#convert labels to numeric values
df$team = transform(labs, df$my_var)

အောက်ဖော်ပြပါ ဥပမာများသည် နည်းလမ်းတစ်ခုစီကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ 1- Base R ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း

အောက်ပါကုဒ်သည် အဖွဲ့ ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်အား ကိန်းဂဏန်းကိန်းရှင်အဖြစ်သို့ ပြောင်းလဲရန် R အခြေခံ အချက်() လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'),
                 points=c(25, 12, 15, 14, 19, 23, 25, 29))

#view data frame
df

  team points
1 to 25
2 to 12
3 B 15
4 B 14
5 B 19
6 B 23
7 C 25
8 C 29

#perform label encoding on team variable
df$team <- as. numeric (factor(df$team))

#view updated data frame
df

  team points
1 1 25
2 1 12
3 2 15
4 2 14
5 2 19
6 2 23
7 3 25
8 3 29

အဖွဲ့ ကော်လံရှိ တန်ဖိုးအသစ်များကို မှတ်သားပါ-

“ A” သည် 1 ဖြစ်လာသည်။
“ B” သည် 2 ဖြစ်လာသည်။
“ C” သည် 3 ဖြစ်လာသည်။

ကျွန်ုပ်တို့သည် အဖွဲ့ ကော်လံကို အမျိုးအစားခွဲခြားသည့်ကိန်းရှင်မှ ဂဏန်းကိန်းပြောင်းလဲနိုင်သောအဖြစ်သို့ အောင်မြင်စွာပြောင်းလဲလိုက်ပါသည်။

ဥပမာ 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း။

အောက်ပါကုဒ်သည် အဖွဲ့ ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်အား ကိန်းဂဏာန်းပြောင်းလဲမှုတစ်ခုအဖြစ်သို့ ပြောင်းလဲရန် CatEncoders() ပက်ကေ့ဂျ်ရှိ လုပ်ဆောင်ချက်များကို မည်သို့အသုံးပြုရမည်ကို ပြသသည်-

 library (CatEncoders)

#create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'),
                 points=c(25, 12, 15, 14, 19, 23, 25, 29))

#define original categorical labels
labs = LabelEncoder. fit (df$team)

#convert labels to numeric values
df$team = transform(labs, df$team)

#view updated data frame
df

  team points
1 1 25
2 1 12
3 2 15
4 2 14
5 2 19
6 2 23
7 3 25
8 3 29

တစ်ဖန်၊ ကျွန်ုပ်တို့သည် အဖွဲ့ ကော်လံတွင် အောက်ပါတန်ဖိုးအသစ်များကို ထုတ်ပေးသည်-

“ A” သည် 1 ဖြစ်လာသည်။
“ B” သည် 2 ဖြစ်လာသည်။
“ C” သည် 3 ဖြစ်လာသည်။

၎င်းသည် ယခင်နမူနာ၏ ရလဒ်များနှင့် ကိုက်ညီပါသည်။

ဤနည်းလမ်းကို အသုံးပြု၍ အဖွဲ့ ကော်လံ၏ မူရင်းတန်ဖိုးများကို ရယူရန် inverse.transform() ကို အသုံးပြုနိုင်သည်။

 #display original team labels
reverse. transform (labs, df$team)

[1] “A” “A” “B” “B” “B” “B” “C” “C”

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် ဆက်ရန်မှ categorical variable တစ်ခုကို ဖန်တီးနည်း
R တွင် categorical variable များကိုဖန်တီးနည်း
categorical variable များကို R တွင် ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ 1- Base R ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း

ဥပမာ 2- CatEncoders ပက်ကေ့ဂျ်ကို အသုံးပြု၍ အညွှန်းများကို ကုဒ်လုပ်ခြင်း။

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။