Scikit-learn- ကော်လံမျိုးစုံ အညွှန်းကုဒ်ကို သုံးပါ။


စက်သင်ယူမှုတွင်၊ အညွှန်းကုဒ်ကုဒ် သည် အမျိုးအစားအလိုက်ကိန်းရှင် ၏တန်ဖိုးများကို ကိန်းပြည့်တန်ဖိုးများအဖြစ်သို့ ပြောင်းလဲခြင်းလုပ်ငန်းစဉ်ဖြစ်သည်။

ဥပမာအားဖြင့်၊ အောက်ဖော်ပြပါ ဖန်သားပြင်ဓာတ်ပုံသည် Team ဟုခေါ်သော အမျိုးအစားခွဲကွဲပြားသည့်ကိန်းရှင်တစ်ခု၏ တစ်မူထူးခြားသောတန်ဖိုးတစ်ခုစီကို အက္ခရာစဉ်အလိုက် ကိန်းပြည့်တန်ဖိုးသို့ မည်သို့ပြောင်းရမည်ကို ပြသသည်-

Python တွင် ကော်လံမျိုးစုံ အညွှန်းစာဝှက်ကို လုပ်ဆောင်ရန် အောက်ပါ syntax ကို သင်အသုံးပြုနိုင်သည်-

 from sklearn. preprocessing import LabelEncoder

#perform label encoding on col1, col2 columns
df[[' col1 ', ' col2 ']] = df[[' col1 ', ' col2 ']]. apply (LabelEncoder(). fit_transform )

အောက်ဖော်ပြပါ ဥပမာသည် ဤ syntax ကို လက်တွေ့တွင် မည်သို့အသုံးပြုရမည်ကို ပြသထားသည်။

ဥပမာ- Python တွင် ကုဒ်နံပါတ်များကို ကုဒ်လုပ်ခြင်း။

အမျိုးမျိုးသော ဘတ်စကတ်ဘောကစားသမားများအကြောင်း အချက်အလက်ပါရှိသော အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'D'],
                   ' position ': ['G', 'F', 'G', 'F', 'F', 'G', 'G', 'F'],
                   ' all_star ': ['Y', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N'],
                   ' points ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team position all_star points
0 AGY 11
1 AFN 8
2 BGY 10
3 BFY 6
4 BFY 6
5 CGN 5
6 CGY 9
7 DFN 12

အဖွဲ့အနေအထား နှင့် all_star ကော်လံများရှိ အမျိုးအစားအလိုက် တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးများအဖြစ်သို့ ပြောင်းလဲရန် အညွှန်းစာဝှက်ကို လုပ်ဆောင်ရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

 from sklearn. preprocessing import LabelEncoder

#perform label encoding across team, position, and all_star columns
df[[' team ', ' position ', ' all_star ']] = df[[' team ', ' position ', ' all_star ']]. apply (LabelEncoder(). fit_transform )

#view udpated DataFrame
print (df)

   team position all_star points
0 0 1 1 11
1 0 0 0 8
2 1 1 1 10
3 1 0 1 6
4 1 0 1 6
5 2 1 0 5
6 2 1 1 9
7 3 0 0 12

ရလဒ်မှ၊ အဖွဲ့ရာထူး နှင့် all_star ကော်လံများ၏ တန်ဖိုးတစ်ခုစီကို ကိန်းပြည့်တန်ဖိုးများအဖြစ်သို့ ပြောင်းလဲထားသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ဥပမာအားဖြင့်၊ အဖွဲ့ ကော်လံတွင် ကျွန်ုပ်တို့တွေ့နိုင်သည်-

  • “A” တန်ဖိုးတစ်ခုစီကို 0 သို့ ပြောင်းထားသည်။
  • “B” တန်ဖိုးတစ်ခုစီကို 1 အဖြစ်သို့ ပြောင်းထားသည်။
  • “ C” တန်ဖိုးတစ်ခုစီကို 2 သို့ပြောင်းထားသည်။
  • “D” တန်ဖိုးတစ်ခုစီကို 3 သို့ပြောင်းထားသည်။

ဤဥပမာတွင် ကျွန်ုပ်တို့သည် DataFrame ကော်လံသုံးခုတွင် အညွှန်းစာဝှက်ကို လုပ်ဆောင်ခဲ့ပြီးဖြစ်သော်လည်း ကျွန်ုပ်တို့အလိုရှိသည့်အတိုင်း အမျိုးအစားအလိုက် ကော်လံအများအပြားတွင် အညွှန်းစာဝှက်ခြင်းလုပ်ဆောင်ရန် အလားတူအစီအမံများကို အသုံးပြုနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော အသုံးများသော အလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Pandas တွင် categorical variable ကို ဂဏန်းအဖြစ် မည်သို့ပြောင်းရမည်နည်း။
Pandas တွင် boolean တန်ဖိုးများကို ကိန်းပြည့်တန်ဖိုးများ မည်သို့ပြောင်းလဲမည်နည်း။
Pandas တွင် နံပါတ်များအဖြစ် စာကြောင်းများကို ကုဒ်လုပ်ရန် factorize() ကို အသုံးပြုနည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်