Python တွင် ဒေတာကို အလယ်ဗဟိုပြုနည်း- ဥပမာများဖြင့်
ဒေတာအစုံကို ဗဟိုပြုခြင်း ဆိုသည်မှာ ဒေတာအစုအတွင်း တစ်ဦးချင်း စီ ကြည့်ရှုမှု တစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို နုတ်ယူခြင်းဖြစ်သည်။
ဒေတာအတွဲတစ်ခုကို ဗဟိုပြုပြီးသည်နှင့်၊ ဒေတာအတွဲ၏ ပျမ်းမျှတန်ဖိုးသည် သုညဖြစ်သွားသည်။
အောက်ပါနမူနာများသည် Python တွင် ဒေတာဗဟိုပြုနည်းကို ပြသထားသည်။
ဥပမာ 1- NumPy အခင်းအကျင်းတစ်ခု၏ တန်ဖိုးများကို ဗဟိုပြုပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါ NumPy array ရှိသည်ဆိုပါစို့။
import numpy as np #create NumPy array data = np. array ([4, 6, 9, 13, 14, 17, 18, 19, 19, 21]) #display mean of array print ( data.mean ()) 14.0
လေ့လာမှုတစ်ခုစီမှ ပျမ်းမျှ array တန်ဖိုးကို နုတ်ရန် function တစ်ခုကို သတ်မှတ်နိုင်သည်-
#create function to data center
center_function = lambda x: x - x. mean ()
#apply function to original NumPy array
data_centered = center_function(data)
#view updated Array
print (data_centered)
array([-10., -8., -5., -1., 0., 3., 4., 5., 5., 7.])
ရလဒ်တန်ဖိုးများသည် dataset ၏ဗဟိုချက်တန်ဖိုးများဖြစ်သည်။
မူရင်းဇယား၏ပျမ်းမျှ 14 ဖြစ်သောကြောင့်၊ ဤလုပ်ဆောင်ချက်သည် မူရင်းဇယားရှိ တန်ဖိုးတစ်ခုစီမှ 14 ကို ရိုးရိုးရှင်းရှင်း နုတ်ယူပါသည်။
ဥပမာအားဖြင့်:
- အလယ်ဗဟိုအာရာ၏ 1st တန်ဖိုး = 4 – 14 = -10
- အလယ်ဗဟို array ၏ ဒုတိယတန်ဖိုး = 6 – 14 = -8
- ဗဟိုအခင်းအကျင်းရှိ တတိယတန်ဖိုး = 9 – 14 = -5
နောက် … ပြီးတော့။
အလယ်ဗဟိုဇယား၏ပျမ်းမျှသည် သုညဖြစ်ကြောင်းကိုလည်း စစ်ဆေးနိုင်သည်။
#display mean of centered array print ( data_centered.mean ()) 0.0
ဥပမာ 2- Pandas DataFrame ကော်လံများကို ဗဟိုပြုပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။
import pandas as pd #createDataFrame df = pd. DataFrame ({' x ': [1, 4, 5, 6, 6, 8, 9], ' y ': [7, 7, 8, 8, 8, 9, 12], ' z ': [3, 3, 4, 4, 6, 7, 7]}) #view DataFrame print (df) X Y Z 0 1 7 3 1 4 7 3 2 5 8 4 3 6 8 4 4 6 8 6 5 8 9 7 6 9 12 7
DataFrame ရှိ ကော်လံတစ်ခုစီ၏ တန်ဖိုးများကို ဗဟိုပြုရန် pandas apply() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။
#center the values in each column of the DataFrame df_centered = df. apply ( lambda x: xx.mean ()) #view centered DataFrame print (df_centered) X Y Z 0 -4.571429 -1.428571 -1.857143 1 -1.571429 -1.428571 -1.857143 2 -0.571429 -0.428571 -0.857143 3 0.428571 -0.428571 -0.857143 4 0.428571 -0.428571 1.142857 5 2.428571 0.571429 2.142857 6 3.428571 3.571429 2.142857
ထို့နောက် ကော်လံတစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးသည် သုညဖြစ်ကြောင်း အတည်ပြုနိုင်သည်-
#display mean of each column in the DataFrame df_centered. mean () x 2.537653e-16 y-2.537653e-16 z 3.806479e-16 dtype:float64
ကော်လံပျမ်းမျှများကို သိပ္ပံနည်းကျအမှတ်အသားဖြင့် ပြသထားသော်လည်း တန်ဖိုးတစ်ခုစီသည် မရှိမဖြစ်အားဖြင့် သုညဖြစ်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-
Python တွင် ဖြတ်တောက်ထားသော ဆိုလိုရင်းကို တွက်ချက်နည်း
Python တွင် Mean Square Error (MSE) ကို တွက်ချက်နည်း
Pandas ရှိ ရွေးချယ်ထားသော ကော်လံများ၏ ပျမ်းမျှအား တွက်ချက်နည်း