Pandas dataframe တွင် ကော်လံများကို ပုံမှန်ဖြစ်အောင်ပြုလုပ်နည်း
ပန်ဒါ DataFrame တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကော်လံများ၏ ဒေတာတန်ဖိုးများကို မကြာခဏ ချိန်ညှိ လိုပေမည်။
ဤသင်ခန်းစာတွင် ဤသို့ပြုလုပ်ရန် နည်းလမ်းနှစ်ခုကို ရှင်းပြထားသည်။
1. Min-Max ပုံမှန်ဖြစ်အောင်လုပ်ပါ။
- ရည်ရွယ်ချက်- ဒေတာတန်ဖိုးတစ်ခုစီကို 0 နှင့် 1 ကြားတန်ဖိုးအဖြစ် ပြောင်းသည်။
- ဖော်မြူလာ- တန်ဖိုးအသစ် = (တန်ဖိုး – မိနစ်) / (အမြင့်ဆုံး – မိနစ်)
2. ပျမ်းမျှ ပုံမှန်ပြန်ဖြစ်ခြင်း။
- ရည်ရွယ်ချက်- တန်ဖိုးများအားလုံး၏ ပျမ်းမျှသည် 0 နှင့် std ဖြစ်သည့် စကေးတန်ဖိုးများ။ dev က ၁။
- ဖော်မြူလာ- တန်ဖိုးအသစ် = (တန်ဖိုး – ပျမ်းမျှ) / (စံသွေဖည်မှု)
Pandas DataFrame တွင် နည်းလမ်းတစ်ခုစီကို အသုံးပြုပုံ နမူနာကို ကြည့်ကြပါစို့။
ဥပမာ 1- min-max normalization
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #view DataFrame print (df) points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6
DataFrame ကော်လံတစ်ခုစီတွင် min-max ပုံမှန်သတ်မှတ်ခြင်းကို အသုံးပြုရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်သည်။
(df-df. min ())/(df. max ()-df. min ()) points assists rebounds 0 1.000000 0.000000 1.0 1 0.000000 0.285714 0.4 2 0.230769 0.285714 0.8 3 0.153846 0.571429 0.0 4 0.538462 1.000000 0.0
ကော်လံတစ်ခုစီရှိ အမြင့်ဆုံးတန်ဖိုးသည် ယခု 1 ဖြစ်ပြီး ကော်လံတစ်ခုစီရှိ min value သည် ယခုအခါ 0 ဖြစ်ပြီး 0 နှင့် 1 အကြားရှိ အခြားတန်ဖိုးများအားလုံးနှင့်အတူ ဖြစ်သည်။
ဥပမာ 2- ပျမ်းမျှ ပုံမှန်ဖြစ်ခြင်း။
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဟု ထပ်မံယူဆကြပါစို့။
import pandas as pd #createDataFrame df = pd.DataFrame({'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #view DataFrame print (df) points assists rebounds 0 25 5 11 1 12 7 8 2 15 7 10 3 14 9 6 4 19 12 6
DataFrame ရှိ ကော်လံတစ်ခုစီတွင် ပျမ်းမျှပုံမှန်ဖြစ်အောင်ပြုလုပ်ရန် အောက်ပါကုဒ်ကို အသုံးပြုနိုင်ပါသည်။
(df- df.mean ())/df. std () points assists rebounds 0 1.554057 -1.133893 1.227881 1 -0.971286 -0.377964 -0.087706 2 -0.388514 -0.377964 0.789352 3 -0.582772 0.377964 -0.964764 4 0.388514 1.511858 -0.964764
ကော်လံတစ်ခုစီရှိ တန်ဖိုးများသည် ယခုအခါ ပုံမှန်ပြုလုပ်ထားပြီးဖြစ်သည့်အတွက် ကော်လံတစ်ခုစီရှိ တန်ဖိုးများ၏ ပျမ်းမျှတန်ဖိုးသည် 0 ဖြစ်ပြီး ကော်လံတစ်ခုစီရှိ တန်ဖိုးများ၏ စံသွေဖည်မှုမှာ 1 ဖြစ်သည်။
ဒေတာအမှတ်တစ်ခုတွင် ပုံမှန်တန်ဖိုးသည် 0 ထက် ကြီးပါက၊ ဒေတာအမှတ်သည် ၎င်း၏ကော်လံ၏ ပျမ်းမျှထက် ပိုများကြောင်း ညွှန်ပြသည်။ အပြန်အလှန်အားဖြင့်၊ 0 ထက်နည်းသော ပုံမှန်တန်ဖိုးသည် ဒေတာအမှတ်သည် ၎င်း၏ကော်လံ၏ပျမ်းမျှအောက်၌ ရှိနေကြောင်း ဖော်ပြသည်။
ထပ်လောင်းအရင်းအမြစ်များ
Pandas- ကော်လံအများအပြားတွင် အုပ်စုဖွဲ့၍ စုစည်းနည်း
အခြေအနေများစွာတွင် Pandas DataFrame ကို စစ်ထုတ်နည်း
Pandas DataFrame တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ရေတွက်နည်း