Python တွင် ဒေတာကို အလယ်ဗဟိုပြုနည်း- ဥပမာများဖြင့်


ဒေတာအစုံကို ဗဟိုပြုခြင်း ဆိုသည်မှာ ဒေတာအစုအတွင်း တစ်ဦးချင်း စီ ကြည့်ရှုမှု တစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးကို နုတ်ယူခြင်းဖြစ်သည်။

ဒေတာအတွဲတစ်ခုကို ဗဟိုပြုပြီးသည်နှင့်၊ ဒေတာအတွဲ၏ ပျမ်းမျှတန်ဖိုးသည် သုညဖြစ်သွားသည်။

အောက်ပါနမူနာများသည် Python တွင် ဒေတာဗဟိုပြုနည်းကို ပြသထားသည်။

ဥပမာ 1- NumPy အခင်းအကျင်းတစ်ခု၏ တန်ဖိုးများကို ဗဟိုပြုပါ။

ကျွန်ုပ်တို့တွင် အောက်ပါ NumPy array ရှိသည်ဆိုပါစို့။

 import numpy as np

#create NumPy array
data = np. array ([4, 6, 9, 13, 14, 17, 18, 19, 19, 21])

#display mean of array
print ( data.mean ())

14.0

လေ့လာမှုတစ်ခုစီမှ ပျမ်းမျှ array တန်ဖိုးကို နုတ်ရန် function တစ်ခုကို သတ်မှတ်နိုင်သည်-

 #create function to data center
center_function = lambda x: x - x. mean ()

#apply function to original NumPy array
data_centered = center_function(data)

#view updated Array
print (data_centered)

array([-10., -8., -5., -1., 0., 3., 4., 5., 5., 7.])

ရလဒ်တန်ဖိုးများသည် dataset ၏ဗဟိုချက်တန်ဖိုးများဖြစ်သည်။

မူရင်းဇယား၏ပျမ်းမျှ 14 ဖြစ်သောကြောင့်၊ ဤလုပ်ဆောင်ချက်သည် မူရင်းဇယားရှိ တန်ဖိုးတစ်ခုစီမှ 14 ကို ရိုးရိုးရှင်းရှင်း နုတ်ယူပါသည်။

ဥပမာအားဖြင့်:

  • အလယ်ဗဟိုအာရာ၏ 1st တန်ဖိုး = 4 – 14 = -10
  • အလယ်ဗဟို array ၏ ဒုတိယတန်ဖိုး = 6 – 14 = -8
  • ဗဟိုအခင်းအကျင်းရှိ တတိယတန်ဖိုး = 9 – 14 = -5

နောက် … ပြီးတော့။

အလယ်ဗဟိုဇယား၏ပျမ်းမျှသည် သုညဖြစ်ကြောင်းကိုလည်း စစ်ဆေးနိုင်သည်။

 #display mean of centered array
print ( data_centered.mean ())

0.0

ဥပမာ 2- Pandas DataFrame ကော်လံများကို ဗဟိုပြုပါ။

ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' x ': [1, 4, 5, 6, 6, 8, 9],
                   ' y ': [7, 7, 8, 8, 8, 9, 12],
                   ' z ': [3, 3, 4, 4, 6, 7, 7]})

#view DataFrame
print (df)

   X Y Z
0 1 7 3
1 4 7 3
2 5 8 4
3 6 8 4
4 6 8 6
5 8 9 7
6 9 12 7

DataFrame ရှိ ကော်လံတစ်ခုစီ၏ တန်ဖိုးများကို ဗဟိုပြုရန် pandas apply() လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည်။

 #center the values in each column of the DataFrame
df_centered = df. apply ( lambda x: xx.mean ())

#view centered DataFrame
print (df_centered)

	        X Y Z
0 -4.571429 -1.428571 -1.857143
1 -1.571429 -1.428571 -1.857143
2 -0.571429 -0.428571 -0.857143
3 0.428571 -0.428571 -0.857143
4 0.428571 -0.428571 1.142857
5 2.428571 0.571429 2.142857
6 3.428571 3.571429 2.142857 

ထို့နောက် ကော်လံတစ်ခုစီ၏ ပျမ်းမျှတန်ဖိုးသည် သုညဖြစ်ကြောင်း အတည်ပြုနိုင်သည်-

 #display mean of each column in the DataFrame
df_centered. mean ()

x 2.537653e-16
y-2.537653e-16
z 3.806479e-16
dtype:float64

ကော်လံပျမ်းမျှများကို သိပ္ပံနည်းကျအမှတ်အသားဖြင့် ပြသထားသော်လည်း တန်ဖိုးတစ်ခုစီသည် မရှိမဖြစ်အားဖြင့် သုညဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော ဘုံလုပ်ဆောင်ချက်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Python တွင် ဖြတ်တောက်ထားသော ဆိုလိုရင်းကို တွက်ချက်နည်း
Python တွင် Mean Square Error (MSE) ကို တွက်ချက်နည်း
Pandas ရှိ ရွေးချယ်ထားသော ကော်လံများ၏ ပျမ်းမျှအား တွက်ချက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်