Pandas dataframe တွင် ကော်လံများကို ပုံမှန်ဖြစ်အောင်ပြုလုပ်နည်း


ပန်ဒါ DataFrame တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကော်လံများ၏ ဒေတာတန်ဖိုးများကို မကြာခဏ ချိန်ညှိ လိုပေမည်။

ဤသင်ခန်းစာတွင် ဤသို့ပြုလုပ်ရန် နည်းလမ်းနှစ်ခုကို ရှင်းပြထားသည်။

1. Min-Max ပုံမှန်ဖြစ်အောင်လုပ်ပါ။

  • ရည်ရွယ်ချက်- ဒေတာတန်ဖိုးတစ်ခုစီကို 0 နှင့် 1 ကြားတန်ဖိုးအဖြစ် ပြောင်းသည်။
  • ဖော်မြူလာ- တန်ဖိုးအသစ် = (တန်ဖိုး – မိနစ်) / (အမြင့်ဆုံး – မိနစ်)

2. ပျမ်းမျှ ပုံမှန်ပြန်ဖြစ်ခြင်း။

  • ရည်ရွယ်ချက်- တန်ဖိုးများအားလုံး၏ ပျမ်းမျှသည် 0 နှင့် std ဖြစ်သည့် စကေးတန်ဖိုးများ။ dev က ၁။
  • ဖော်မြူလာ- တန်ဖိုးအသစ် = (တန်ဖိုး – ပျမ်းမျှ) / (စံသွေဖည်မှု)

Pandas DataFrame တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုပုံ နမူနာကို ကြည့်ကြပါစို့။

ဥပမာ 1- min-max normalization

ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]}) 

#view DataFrame
print (df)

   points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

DataFrame ကော်လံတစ်ခုစီတွင် min-max ပုံမှန်သတ်မှတ်ခြင်းကို အသုံးပြုရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။

 (df-df. min ())/(df. max ()-df. min ())

        points assists rebounds
0 1.000000 0.000000 1.0
1 0.000000 0.285714 0.4
2 0.230769 0.285714 0.8
3 0.153846 0.571429 0.0
4 0.538462 1.000000 0.0

ကော်လံတစ်ခုစီရှိ အမြင့်ဆုံးတန်ဖိုးသည် ယခု 1 ဖြစ်ပြီး ကော်လံတစ်ခုစီရှိ min value သည် ယခုအခါ 0 ဖြစ်ပြီး 0 နှင့် 1 အကြားရှိ အခြားတန်ဖိုးများအားလုံးနှင့်အတူ ဖြစ်သည်။

ဥပမာ 2- ပျမ်းမျှ ပုံမှန်ဖြစ်ခြင်း။

ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဟု ထပ်မံယူဆကြပါစို့။

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]}) 

#view DataFrame
print (df)

   points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

DataFrame ရှိ ကော်လံတစ်ခုစီတွင် ပျမ်းမျှပုံမှန်ဖြစ်အောင်ပြုလုပ်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်ပါသည်။

 (df- df.mean ())/df. std ()

        points assists rebounds
0 1.554057 -1.133893 1.227881
1 -0.971286 -0.377964 -0.087706
2 -0.388514 -0.377964 0.789352
3 -0.582772 0.377964 -0.964764
4 0.388514 1.511858 -0.964764

ကော်လံတစ်ခုစီရှိ တန်ဖိုးများသည် ယခုအခါ ပုံမှန်ပြုလုပ်ထားပြီးဖြစ်သည့်အတွက် ကော်လံတစ်ခုစီရှိ တန်ဖိုးများ၏ ပျမ်းမျှတန်ဖိုးသည် 0 ဖြစ်ပြီး ကော်လံတစ်ခုစီရှိ တန်ဖိုးများ၏ စံသွေဖည်မှုမှာ 1 ဖြစ်သည်။

ဒေတာအမှတ်တစ်ခုတွင် ပုံမှန်တန်ဖိုးသည် 0 ထက် ကြီးပါက၊ ဒေတာအမှတ်သည် ၎င်း၏ကော်လံ၏ ပျမ်းမျှထက် ပိုများကြောင်း ညွှန်ပြသည်။ အပြန်အလှန်အားဖြင့်၊ 0 ထက်နည်းသော ပုံမှန်တန်ဖိုးသည် ဒေတာအမှတ်သည် ၎င်း၏ကော်လံ၏ပျမ်းမျှအောက်၌ ရှိနေကြောင်း ဖော်ပြသည်။

ထပ်လောင်းအရင်းအမြစ်များ

Pandas- ကော်လံအများအပြားတွင် အုပ်စုဖွဲ့၍ စုစည်းနည်း
အခြေအနေများစွာတွင် Pandas DataFrame ကို စစ်ထုတ်နည်း
Pandas DataFrame တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ရေတွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်