Python တွင် label encoding လုပ်နည်း (ဥပမာနှင့်အတူ)


စက်သင်ယူမှုတွင် မကြာခဏဆိုသလို ကျွန်ုပ်တို့သည် အယ်လဂိုရီသမ်များဖြင့် အလွယ်တကူ အသုံးပြုနိုင်သော ဂဏန်းဖော်မတ်အချို့သို့ အမျိုးအစားအလိုက် ကိန်း ရှင်များ ကို ပြောင်းလဲလိုကြသည်။

၎င်းကိုလုပ်ဆောင်ရန်နည်းလမ်းတစ်ခု မှာ အက္ခရာစဉ်အလိုက် အမျိုးအစားအလိုက်တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးတစ်ခုသတ်မှတ်ပေးသည့် အညွှန်းစာဝှက်ကို အသုံးပြုရန်ဖြစ်သည်

ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် Team ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခု၏ တစ်မူထူးခြားသောတန်ဖိုးတစ်ခုစီကို အက္ခရာစဉ်အလိုက် ကိန်းပြည့်တန်ဖိုးသို့ မည်သို့ပြောင်းရမည်ကို ပြသသည်-

Python တွင် အညွှန်းစာဝှက်ကို လုပ်ဆောင်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 from sklearn. preprocessing import LabelEncoder

#create instance of label encoder
lab = LabelEncoder()

#perform label encoding on 'team' column
df[' my_column '] = lab. fit_transform (df[' my_column '])

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- Python တွင် ကုဒ်နံပါတ်များကို ကုဒ်လုပ်ခြင်း။

ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29]})

#view DataFrame
print (df)

  team points
0 to 25
1 to 12
2 B 15
3 B 14
4 B 19
5 B 23
6 C 25
7 C 29

အဖွဲ့ ကော်လံရှိ အမျိုးအစားအလိုက် တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးအဖြစ်သို့ ပြောင်းလဲရန် အညွှန်းစာဝှက်ကို လုပ်ဆောင်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။

 from sklearn. preprocessing import LabelEncoder

#create instance of label encoder
lab = LabelEncoder()

#perform label encoding on 'team' column
df[' team '] = lab. fit_transform (df[' team '])

#view updated DataFrame
print (df)

   team points
0 0 25
1 0 12
2 1 15
3 1 14
4 1 19
5 1 23
6 2 25
7 2 29

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • “A” တန်ဖိုးတစ်ခုစီကို 0 သို့ ပြောင်းထားသည်။
  • “B” တန်ဖိုးတစ်ခုစီကို 1 အဖြစ်သို့ ပြောင်းထားသည်။
  • “C” တန်ဖိုးတစ်ခုစီကို 2 သို့ပြောင်းထားသည်။

အဖွဲ့ ကော်လံ၏မူလတန်ဖိုးများကိုရယူရန် သင် inverse_transform() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်ကြောင်း သတိပြုပါ။

 #display original team labels
lab. inverse_transform (df[' team '])

array(['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], dtype=object)

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော အသုံးများသော အလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas တွင် categorical variable ကို ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။
Pandas တွင် boolean တန်ဖိုးများကို ကိန်းပြည့်တန်ဖိုးများ မည်သို့ပြောင်းလဲမည်နည်း။
Pandas တွင် နံပါတ်များအဖြစ် စာကြောင်းများကို ကုဒ်လုပ်ရန် factorize() ကို အသုံးပြုနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်