ပန်ဒါများတွင် အုပ်စုလိုက်တွေ့ခြင်းကို ရေတွက်နည်း


ပန်ဒါ DataFrame တွင် အုပ်စုတစ်ခုစီမှ စောင့်ကြည့်မှု အရေအတွက်ကို ရေတွက်ရန် မကြာခဏ သင်စိတ်ဝင်စားပေမည်။

ကံကောင်းထောက်မစွာ၊ ၎င်းသည် အောက်ပါ syntax ဖြင့် groupby() နှင့် size() လုပ်ဆောင်ချက်များကို အသုံးပြု၍ လုပ်ဆောင်ရန် လွယ်ကူပါသည်။

 df. groupby (' column_name '). size ()

ဤသင်ခန်းစာတွင် အောက်ပါဒေတာဘောင်ကို အသုံးပြု၍ ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးပြုခြင်း၏ ဥပမာများစွာကို ရှင်းပြထားသည်။

 import numpy as np
import pandas as pd

#create pandas DataFrame
df = pd. DataFrame ({'team': ['A', 'A', 'B', 'B', 'B', 'C', 'C'],
                   'division':['E', 'W', 'E', 'E', 'W', 'W', 'E'],
                   'rebounds': [11, 8, 7, 6, 6, 5, 12]})

#display DataFrame
print (df)

  team division rebounds
0 AE 11
1 AW 8
2 BE 7
3 BE 6
4 BW 6
5 CW 5
6 CE 12

ဥပမာ 1- ကိန်းရှင်တစ်ခုဖြင့် ရေတွက်ခြင်း။

အောက်ဖော်ပြပါ ကုဒ်သည် အဖွဲ့တစ်ဖွဲ့လျှင် စောင့်ကြည့်မှု စုစုပေါင်းကို ရေတွက်နည်းကို ပြသသည်-

 #count total observations by variable 'team'
df. groupby (' team '). size ()

team
At 2
B 3
C 2
dtype: int64

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • Team A မှာ ၂ ချက်ရှိပါတယ်။
  • Team B မှာ ၃ ချက်ရှိပါတယ်။
  • Team C မှာ ၂ ချက်ရှိပါတယ်။

ရှေ့ကုဒ်သည် စီးရီးတစ်ခုထုတ်ပေးကြောင်း သတိပြုပါ။ ကိစ္စအများစုတွင် ကျွန်ုပ်တို့သည် DataFrame တစ်ခုနှင့် အလုပ်လုပ်လိုသောကြောင့်၊ ၎င်းအစား DataFrame တစ်ခုထုတ်လုပ်ရန် reset_index() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ပါသည်။

 df. groupby (' team '). size (). reset_index (name=' obs ')

        team obs
0 to 2
1 B 3
2 C 2

ဥပမာ 2- ကိန်းရှင်တစ်ခုအလိုက် ရေတွက်ပြီး စီပါ။

အဖွဲ့အရေအတွက်ကိုခွဲရန် sort_values() လုပ်ဆောင်ချက်ကိုလည်း အသုံးပြုနိုင်သည်။

ကျွန်ုပ်တို့သည် ascending=False ကိုသတ်မှတ်နိုင်သည်-အကြီးဆုံးမှအသေးဆုံးသို့အုပ်စုအရေအတွက်ကိုစီရန် သို့မဟုတ် ကြီးတက်နေသည်=အသေးငယ်ဆုံးမှအကြီးဆုံးသို့ခွဲရန်အမှန်ဖြစ်သည်

 df. groupby (' team '). size (). reset_index (name=' obs '). sort_values ([' obs '], ascending= True )

        team obs
0 to 2
2 C 2
1 B 3

ဥပမာ 3- ကိန်းရှင်များစွာဖြင့် ရေတွက်ခြင်း။

pandas DataFrame တွင် ကိန်းရှင်များစွာဖြင့် အုပ်စုဖွဲ့ထားသော လေ့လာတွေ့ရှိချက်အရေအတွက်ကိုလည်း ရေတွက်နိုင်သည်-

 #count observations grouped by team and division
df. groupby ([' team ',' division ']). size (). reset_index (name=' obs ')

        team division obs
0 A E 1
1 A W 1
2 B E 2
3 B W 1
4 C E 1
5 C W 1

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • စောင့်ကြည့်မှု ၁ ခုသည် အသင်း A နှင့် ဌာနခွဲ E တို့ဖြစ်သည်။
  • စောင့်ကြည့်မှု ၁ ခုသည် အသင်း A နှင့် ဌာနခွဲ W တို့ဖြစ်သည်။
  • လေ့လာတွေ့ရှိချက် 2 ခုသည် အသင်း B နှင့် Division E တို့ဖြစ်သည်။
  • စောင့်ကြည့်မှု 1 ခုသည် အသင်း B နှင့် Division W တို့ဖြစ်သည်။
  • စောင့်ကြည့်မှု 1 ခုသည် အသင်း C နှင့် Division E တို့ဖြစ်သည်။
  • စောင့်ကြည့်မှု ၁ ခုသည် အသင်း C နှင့် ဌာနခွဲ W တို့ဖြစ်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

Pandas ရှိ ကော်လံပေါင်းကို တွက်နည်း
Pandas ရှိ ကော်လံများ၏ ပျမ်းမျှအား တွက်ချက်နည်း
Pandas ရှိ ကော်လံများ၏ အမြင့်ဆုံးတန်ဖိုးကို မည်သို့ရှာမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်