Python တွင် label encoding လုပ်နည်း (ဥပမာနှင့်အတူ)
စက်သင်ယူမှုတွင် မကြာခဏဆိုသလို ကျွန်ုပ်တို့သည် အယ်လဂိုရီသမ်များဖြင့် အလွယ်တကူ အသုံးပြုနိုင်သော ဂဏန်းဖော်မတ်အချို့သို့ အမျိုးအစားအလိုက် ကိန်း ရှင်များ ကို ပြောင်းလဲလိုကြသည်။
၎င်းကိုလုပ်ဆောင်ရန်နည်းလမ်းတစ်ခု မှာ အက္ခရာစဉ်အလိုက် အမျိုးအစားအလိုက်တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးတစ်ခုသတ်မှတ်ပေးသည့် အညွှန်းစာဝှက်ကို အသုံးပြုရန်ဖြစ်သည် ။
ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် Team ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခု၏ တစ်မူထူးခြားသောတန်ဖိုးတစ်ခုစီကို အက္ခရာစဉ်အလိုက် ကိန်းပြည့်တန်ဖိုးသို့ မည်သို့ပြောင်းရမည်ကို ပြသသည်-
Python တွင် အညွှန်းစာဝှက်ကို လုပ်ဆောင်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-
from sklearn. preprocessing import LabelEncoder #create instance of label encoder lab = LabelEncoder() #perform label encoding on 'team' column df[' my_column '] = lab. fit_transform (df[' my_column '])
အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။
ဥပမာ- Python တွင် ကုဒ်နံပါတ်များကို ကုဒ်လုပ်ခြင်း။
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
' points ': [25, 12, 15, 14, 19, 23, 25, 29]})
#view DataFrame
print (df)
team points
0 to 25
1 to 12
2 B 15
3 B 14
4 B 19
5 B 23
6 C 25
7 C 29
အဖွဲ့ ကော်လံရှိ အမျိုးအစားအလိုက် တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးအဖြစ်သို့ ပြောင်းလဲရန် အညွှန်းစာဝှက်ကို လုပ်ဆောင်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။
from sklearn. preprocessing import LabelEncoder #create instance of label encoder lab = LabelEncoder() #perform label encoding on 'team' column df[' team '] = lab. fit_transform (df[' team ']) #view updated DataFrame print (df) team points 0 0 25 1 0 12 2 1 15 3 1 14 4 1 19 5 1 23 6 2 25 7 2 29
ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-
- “A” တန်ဖိုးတစ်ခုစီကို 0 သို့ ပြောင်းထားသည်။
- “B” တန်ဖိုးတစ်ခုစီကို 1 အဖြစ်သို့ ပြောင်းထားသည်။
- “C” တန်ဖိုးတစ်ခုစီကို 2 သို့ပြောင်းထားသည်။
အဖွဲ့ ကော်လံ၏မူလတန်ဖိုးများကိုရယူရန် သင် inverse_transform() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်ကြောင်း သတိပြုပါ။
#display original team labels lab. inverse_transform (df[' team ']) array(['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], dtype=object)
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော အသုံးများသော အလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Pandas တွင် categorical variable ကို ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။
Pandas တွင် boolean တန်ဖိုးများကို ကိန်းပြည့်တန်ဖိုးများ မည်သို့ပြောင်းလဲမည်နည်း။
Pandas တွင် နံပါတ်များအဖြစ် စာကြောင်းများကို ကုဒ်လုပ်ရန် factorize() ကို အသုံးပြုနည်း