Pandas: cara menghitung jumlah kumulatif per kelompok


Anda dapat menggunakan sintaks berikut untuk menghitung jumlah kumulatif per grup di panda:

 df[' cumsum_col '] = df. groupby ([' col1 '])[' col2 ']. cumsum ()

Rumus khusus ini menghitung jumlah kumulatif col2 , dikelompokkan berdasarkan col1 , dan menampilkan hasilnya di kolom baru berjudul cumsum_col .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: hitung jumlah kumulatif per grup di Pandas

Katakanlah kita memiliki pandas DataFrame berikut yang berisi informasi penjualan untuk berbagai toko:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' sales ': [4, 7, 10, 5, 8, 9, 12, 15, 10, 8]})

#view DataFrame
print (df)

  blind sales
0 to 4
1 to 7
2 to 10
3 to 5
4 to 8
5 B 9
6 B 12
7 B 15
8 B 10
9 B 8

Kita dapat menggunakan sintaks berikut untuk menghitung jumlah kumulatif penjualan untuk setiap toko:

 #add column that shows cumulative sum of sales by store
df[' cumsum_sales '] = df. groupby ([' store '])[' sales ']. cumsum ()

#view updated DataFrame
print (df)

  store sales cumsum_sales
0 to 4 4
1 to 7 11
2 to 10 21
3 to 5 26
4 to 8 34
5 B 9 9
6 B 12 21
7 B 15 36
8 B 10 46
9 B 8 54

Kolom cumsum_sales menampilkan penjualan kumulatif yang dikelompokkan berdasarkan masing-masing toko.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi cumsum di pandas di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Cara menjumlahkan kolom tertentu di Pandas
Cara menjumlahkan kolom berdasarkan kondisi di Pandas
Cara menghitung jumlah kumulatif terbalik di panda

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *