Pandas- ကော်လံအများအပြားတွင် အုပ်စုဖွဲ့၍ စုစည်းနည်း
မကြာခဏဆိုသလို သင်သည် ပန်ဒါ DataFrame ကော်လံများစွာကို အုပ်စုဖွဲ့ပြီး စုစည်းလိုပေမည်။
ကံကောင်းစွာဖြင့်၊ ၎င်းသည် pandas .groupby() နှင့် .agg() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။
ဤသင်ခန်းစာတွင် ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးပြုခြင်း၏ ဥပမာများစွာကို ရှင်းပြထားသည်။
ဥပမာ 1- ကော်လံနှစ်ခုဖြင့် အုပ်စုဖွဲ့ပြီး ပျမ်းမျှကို ရှာပါ။
ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။
import pandas as pd #createDataFrame df = pd.DataFrame({'team': ['A', 'B', 'B', 'B', 'B', 'M', 'M', 'M'], 'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'], 'assists': [5, 7, 7, 8, 5, 7, 6, 9], 'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]}) #view DataFrame print (df) team position assists rebounds 0 AG 5 11 1 BG 7 8 2 BF 7 10 3 BG 8 6 4 BF 5 6 5 MF 7 9 6 MC 6 6 7 MC 9 10
အောက်ပါကုဒ်သည် “ အဖွဲ့” နှင့် “ ရာထူး” ကော်လံများအလိုက် အုပ်စုဖွဲ့နည်းကို ပြသပြီး ပျမ်းမျှဖြတ်သန်းမှုများကို ရှာပါ-
df. groupby (['team', 'position']). agg ({'assists': ['mean']}). reset_index () team position assists mean 0 A G 5.0 1 B F 6.0 2 B G 7.5 3 M C 7.5 4M F 7.0
အထွက်သည် ကျွန်ုပ်တို့အား ပြောပြသည်-
- အသင်း A ၏ အနေအထား G တွင် ကစားသမားများအတွက် ပျမ်းမျှ ပံ့ပိုးကူညီမှုသည် 5.0 ဖြစ်သည်။
- အသင်း B တွင် အနေအထား F တွင်ရှိသော ကစားသမားများအတွက် ပျမ်းမျှ ပံ့ပိုးကူညီမှုသည် 6.0 ဖြစ်သည်။
- အသင်း B ၏ အနေအထားတွင် ကစားသမားများအတွက် ပျမ်းမျှ ပံ့ပိုးကူညီမှုသည် 7.5 ဖြစ်သည်။
နောက် … ပြီးတော့။
ရရှိလာသော DataFrame ကော်လံများကို အမည်ပြောင်းရန် အောက်ပါကုဒ်ကိုလည်း အသုံးပြုနိုင်ပါသည်။
#group by team and position and find mean assists new = df. groupby (['team', 'position']). agg ({'assists': ['mean']}). reset_index () #rename columns new.columns = ['team', 'pos', 'mean_assists'] #view DataFrame print (new) team pos mean_assists 0 A G 5.0 1 B F 6.0 2 B G 7.5 3 M C 7.5 4M F 7.0
ဥပမာ 2- ကော်လံနှစ်ခုဖြင့် အုပ်စုဖွဲ့ပြီး စာရင်းအင်းများစွာကို ရှာပါ။
ယခင်ဥပမာအတိုင်း ပန်ဒါ DataFrame ကို ကျွန်ုပ်တို့ အသုံးပြုနေသည်ဟု ယူဆကြပါစို့။
import pandas as pd #createDataFrame df = pd.DataFrame({'team': ['A', 'B', 'B', 'B', 'B', 'M', 'M', 'M'], 'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'], 'assists': [5, 7, 7, 8, 5, 7, 6, 9], 'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})
အောက်ဖော်ပြပါ ကုဒ်သည် “ အဖွဲ့” နှင့် “ ရာထူး” ကော်လံများတွင် အုပ်စုဖွဲ့ထားသော ပျမ်းမျှနှင့် အများဆုံး အကြိမ်ရေကို မည်သို့ရှာဖွေရမည်ကို ပြသသည်-
df. groupby (['team', 'position']). agg ({'rebounds': ['median', 'max']}). reset_index () team position rebounds median max 0 A G 11 11 1 B F 8 10 2 B G 7 8 3 M C 8 10 4 M F 9 9
အထွက်သည် ကျွန်ုပ်တို့အား ပြောပြသည်-
- Team A ရှိ G အနေအထားရှိ ကစားသမားများအတွက် ပျမ်းမျှပြန်ခုန်နှုန်းသည် 11 ဖြစ်သည်။
- အသင်း A ၏ အနေအထား G တွင် ကစားသမားများအတွက် အများဆုံး ပြန်ခုန်နှုန်းသည် 11 ဖြစ်သည်။
- အသင်း B ၏ အနေအထား F တွင်ရှိသော ကစားသမားများ၏ ပျမ်းမျှပြန်တက်နှုန်းမှာ 8 ဖြစ်သည်။
- အသင်း B ၏ အနေအထား F တွင် ကစားသမားများအတွက် အများဆုံး ပြန်ခုန်နှုန်းသည် 10 ဖြစ်သည်။
နောက် … ပြီးတော့။
ထပ်လောင်းအရင်းအမြစ်များ
အခြေအနေများစွာတွင် Pandas DataFrame ကို စစ်ထုတ်နည်း
Pandas DataFrame တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ရေတွက်နည်း
Pandas DataFrames မျိုးစုံကို ဘယ်လိုစုမလဲ။