Python တွင် ဒေတာစံနှုန်းသတ်မှတ်နည်း- ဥပမာများဖြင့်


ဒေတာအတွဲကို စံသတ်မှတ်ခြင်း သည် ပျမ်းမျှတန်ဖိုးသည် 0 ဖြစ်ပြီး စံသွေဖည်မှုမှာ 1 ဖြစ်သည့်အတွက် ဒေတာအတွဲရှိ တန်ဖိုးအားလုံးကို အတိုင်းအတာကို ချဲ့ထွင်ခြင်းဖြစ်သည်။

ကျွန်ုပ်တို့သည် ဒေတာအတွဲတစ်ခုတွင် တန်ဖိုးများကို ပုံမှန်ဖြစ်စေရန် အောက်ပါဖော်မြူလာကို အသုံးပြုပါသည်။

x အသစ် = (x ix ) / s

ရွှေ-

  • x i : dataset ၏ ith တန်ဖိုး
  • x : နမူနာကိုဆိုလိုသည်။
  • s : နမူနာ၏ စံသွေဖည်မှု

Python ရှိ Python ရှိ ပန်ဒါ DataFrame အတွင်းရှိ ကော်လံအားလုံးကို လျင်မြန်စွာ ပုံမှန်ဖြစ်စေရန် အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 (df- df.mean ())/df. std ()

အောက်ပါဥပမာများသည် ဤ syntax ကိုလက်တွေ့တွင်မည်သို့အသုံးပြုရမည်ကိုပြသထားသည်။

ဥပမာ 1- DataFrame ကော်လံအားလုံးကို စံသတ်မှတ်ပါ။

အောက်ပါ ကုဒ်သည် ပန်ဒါ DataFrame တွင် ကော်လံအားလုံးကို စံသတ်မှတ်နည်းကို ပြသသည်-

 import pandas as pd

#create data frame
df = pd. DataFrame ({' y ': [8, 12, 15, 14, 19, 23, 25, 29],
                   ' x1 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' x2 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' x3 ': [2, 2, 3, 2, 5, 5, 7, 9]})

#view data frame
df

	y x1 x2 x3
0 8 5 11 2
1 12 7 8 2
2 15 7 10 3
3 14 9 6 2
4 19 12 6 5
5 23 9 5 5
6 25 9 9 7
7 29 4 12 9

#standardize the values in each column
df_new = (df- df.mean ())/df. std ()

#view new data frame
df_new

	        y x1 x2 x3
0 -1.418032 -1.078639 1.025393 -0.908151
1 -0.857822 -0.294174 -0.146485 -0.908151
2 -0.437664 -0.294174 0.634767 -0.525772
3 -0.577717 0.490290 -0.927736 -0.908151
4 0.122546 1.666987 -0.927736 0.238987
5 0.682756 0.490290 -1.318362 0.238987
6 0.962861 0.490290 0.244141 1.003746
7 1.523071 -1.470871 1.416019 1.768505

ကော်လံတစ်ခုစီ၏ ပျမ်းမျှနှင့် စံသွေဖည်မှုသည် 0 နှင့် 1 တို့နှင့် အသီးသီး တူညီကြောင်း ကျွန်ုပ်တို့ အတည်ပြုနိုင်သည်-

 #view mean of each column
df_new. mean ()

y 0.000000e+00
x1 2.775558e-17
x2 -4.163336e-17
x3 5.551115e-17
dtype:float64

#view standard deviation of each column
df_new. std ()

y 1.0
x1 1.0
x2 1.0
x3 1.0
dtype:float64

ဥပမာ 2- သီးခြား DataFrame ကော်လံများကို ပုံမှန်လုပ်ပါ။

တစ်ခါတစ်ရံ သင်သည် DataFrame တွင် သီးခြားကော်လံများကိုသာ ပုံမှန်ဖြစ်အောင် ပြုလုပ်လိုပေမည်။

ဥပမာအားဖြင့်၊ စက်သင်ယူမှု အယ်လဂိုရီသမ်များစွာအတွက်၊ အချက်အလက်အချို့နှင့် မကိုက်ညီမီ ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို စံသတ်မှတ်ရန်သာ လိုပေမည်။

အောက်ပါကုဒ်သည် pandas DataFrame ရှိ သီးခြားကော်လံများကို စံသတ်မှတ်နည်းကို ပြသသည်-

 import pandas as pd

#create data frame
df = pd. DataFrame ({' y ': [8, 12, 15, 14, 19, 23, 25, 29],
                   ' x1 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' x2 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' x3 ': [2, 2, 3, 2, 5, 5, 7, 9]})

#view data frame
df

	y x1 x2 x3
0 8 5 11 2
1 12 7 8 2
2 15 7 10 3
3 14 9 6 2
4 19 12 6 5
5 23 9 5 5
6 25 9 9 7
7 29 4 12 9

#define predictor variable columns
df_x = df[[' x1 ', ' x2 ', ' x3 ']]

#standardize the values for each predictor variable
df[[' x1 ',' x2 ',' x3 ']] = (df_x- df_x.mean ())/df_x. std ()

#view new data frame
df

         y x1 x2 x3
0 8 -1.078639 1.025393 -0.908151
1 12 -0.294174 -0.146485 -0.908151
2 15 -0.294174 0.634767 -0.525772
3 14 0.490290 -0.927736 -0.908151
4 19 1.666987 -0.927736 0.238987
5 23 0.490290 -1.318362 0.238987
6 25 0.490290 0.244141 1.003746
7 29 -1.470871 1.416019 1.768505

ကော်လံ “ y” သည် မပြောင်းလဲကြောင်း သတိပြုပါ၊ သို့သော် ကော်လံ “ x1” “ x2” နှင့် “ x3” အားလုံးကို စံသတ်မှတ်ထားပါသည်။

ကြိုတင်ခန့်မှန်းကိန်းရှင်များ ကော်လံတစ်ခုစီ၏ ပျမ်းမျှနှင့် စံသွေဖည်မှုသည် 0 နှင့် 1 အသီးသီး တူညီကြောင်း ကျွန်ုပ်တို့ အတည်ပြုနိုင်သည်-

 #view mean of each predictor variable column
df[[' x1 ', ' x2 ', ' x3 ']]. mean ()

x1 2.775558e-17
x2 -4.163336e-17
x3 5.551115e-17
dtype:float64

#view standard deviation of each predictor variable column
df[[' x1 ', ' x2 ', ' x3 ']]. std ()

x1 1.0
x2 1.0
x3 1.0
dtype:float64

ထပ်လောင်းအရင်းအမြစ်များ

Pandas DataFrame တွင် ကော်လံများကို ပုံမှန်ဖြစ်အောင် လုပ်နည်း
Python ရှိ Outliers များကို မည်ကဲ့သို့ ဖယ်ရှားနည်း
စံသတ်မှတ်ခြင်း သို့မဟုတ် ပုံမှန်ပြုလုပ်ခြင်း- ကွာခြားချက်ကား အဘယ်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်