Pandas- ကော်လံအများအပြားတွင် အုပ်စုဖွဲ့၍ စုစည်းနည်း


မကြာခဏဆိုသလို သင်သည် ပန်ဒါ DataFrame ကော်လံများစွာကို အုပ်စုဖွဲ့ပြီး စုစည်းလိုပေမည်။

ကံကောင်းစွာဖြင့်၊ ၎င်းသည် pandas .groupby() နှင့် .agg() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူသည်။

ဤသင်ခန်းစာတွင် ဤလုပ်ဆောင်ချက်များကို လက်တွေ့အသုံးပြုခြင်း၏ ဥပမာများစွာကို ရှင်းပြထားသည်။

ဥပမာ 1- ကော်လံနှစ်ခုဖြင့် အုပ်စုဖွဲ့ပြီး ပျမ်းမျှကို ရှာပါ။

ကျွန်ုပ်တို့တွင် အောက်ပါ ပန်ဒါ DataFrame ရှိသည် ဆိုပါစို့။

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'team': ['A', 'B', 'B', 'B', 'B', 'M', 'M', 'M'],
                   'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})

#view DataFrame
print (df)

  team position assists rebounds
0 AG 5 11
1 BG 7 8
2 BF 7 10
3 BG 8 6
4 BF 5 6
5 MF 7 9
6 MC 6 6
7 MC 9 10

အောက်ပါကုဒ်သည် “ အဖွဲ့” နှင့် “ ရာထူး” ကော်လံများအလိုက် အုပ်စုဖွဲ့နည်းကို ပြသပြီး ပျမ်းမျှဖြတ်သန်းမှုများကို ရှာပါ-

 df. groupby (['team', 'position']). agg ({'assists': ['mean']}). reset_index ()


        team position assists
                          mean
0 A G 5.0
1 B F 6.0
2 B G 7.5
3 M C 7.5
4M F 7.0

အထွက်သည် ကျွန်ုပ်တို့အား ပြောပြသည်-

  • အသင်း A ၏ အနေအထား G တွင် ကစားသမားများအတွက် ပျမ်းမျှ ပံ့ပိုးကူညီမှုသည် 5.0 ဖြစ်သည်။
  • အသင်း B တွင် အနေအထား F တွင်ရှိသော ကစားသမားများအတွက် ပျမ်းမျှ ပံ့ပိုးကူညီမှုသည် 6.0 ဖြစ်သည်။
  • အသင်း B ၏ အနေအထားတွင် ကစားသမားများအတွက် ပျမ်းမျှ ပံ့ပိုးကူညီမှုသည် 7.5 ဖြစ်သည်။

နောက် … ပြီးတော့။

ရရှိလာသော DataFrame ကော်လံများကို အမည်ပြောင်းရန် အောက်ပါကုဒ်ကိုလည်း အသုံးပြုနိုင်ပါသည်။

 #group by team and position and find mean assists
new = df. groupby (['team', 'position']). agg ({'assists': ['mean']}). reset_index ()

#rename columns
new.columns = ['team', 'pos', 'mean_assists']

#view DataFrame
print (new)

	team pos mean_assists
0 A G 5.0
1 B F 6.0
2 B G 7.5
3 M C 7.5
4M F 7.0

ဥပမာ 2- ကော်လံနှစ်ခုဖြင့် အုပ်စုဖွဲ့ပြီး စာရင်းအင်းများစွာကို ရှာပါ။

ယခင်ဥပမာအတိုင်း ပန်ဒါ DataFrame ကို ကျွန်ုပ်တို့ အသုံးပြုနေသည်ဟု ယူဆကြပါစို့။

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'team': ['A', 'B', 'B', 'B', 'B', 'M', 'M', 'M'],
                   'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})

အောက်ဖော်ပြပါ ကုဒ်သည် “ အဖွဲ့” နှင့် “ ရာထူး” ကော်လံများတွင် အုပ်စုဖွဲ့ထားသော ပျမ်းမျှနှင့် အများဆုံး အကြိမ်ရေကို မည်သို့ရှာဖွေရမည်ကို ပြသသည်-

 df. groupby (['team', 'position']). agg ({'rebounds': ['median', 'max']}). reset_index ()


        team position rebounds
                         median max
0 A G 11 11
1 B F 8 10
2 B G 7 8
3 M C 8 10
4 M F 9 9

အထွက်သည် ကျွန်ုပ်တို့အား ပြောပြသည်-

  • Team A ရှိ G အနေအထားရှိ ကစားသမားများအတွက် ပျမ်းမျှပြန်ခုန်နှုန်းသည် 11 ဖြစ်သည်။
  • အသင်း A ၏ အနေအထား G တွင် ကစားသမားများအတွက် အများဆုံး ပြန်ခုန်နှုန်းသည် 11 ဖြစ်သည်။
  • အသင်း B ၏ အနေအထား F တွင်ရှိသော ကစားသမားများ၏ ပျမ်းမျှပြန်တက်နှုန်းမှာ 8 ဖြစ်သည်။
  • အသင်း B ၏ အနေအထား F တွင် ကစားသမားများအတွက် အများဆုံး ပြန်ခုန်နှုန်းသည် 10 ဖြစ်သည်။

နောက် … ပြီးတော့။

ထပ်လောင်းအရင်းအမြစ်များ

အခြေအနေများစွာတွင် Pandas DataFrame ကို စစ်ထုတ်နည်း
Pandas DataFrame တွင် ပျောက်ဆုံးနေသောတန်ဖိုးများကို ရေတွက်နည်း
Pandas DataFrames မျိုးစုံကို ဘယ်လိုစုမလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်