Pandas: 그룹당 누적 합계를 계산하는 방법
다음 구문을 사용하여 팬더에서 그룹당 누적 합계를 계산할 수 있습니다.
df[' cumsum_col '] = df. groupby ([' col1 '])[' col2 ']. cumsum ()
이 특정 수식은 col1 로 그룹화된 col2 의 누적 합계를 계산하고 cumsum_col 이라는 새 열에 결과를 표시합니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: Pandas에서 그룹당 누적 합계 계산
다양한 매장의 판매 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' sales ': [4, 7, 10, 5, 8, 9, 12, 15, 10, 8]}) #view DataFrame print (df) blind sales 0 to 4 1 to 7 2 to 10 3 to 5 4 to 8 5 B 9 6 B 12 7 B 15 8 B 10 9 B 8
다음 구문을 사용하여 각 매장의 누적 매출 합계를 계산할 수 있습니다.
#add column that shows cumulative sum of sales by store
df[' cumsum_sales '] = df. groupby ([' store '])[' sales ']. cumsum ()
#view updated DataFrame
print (df)
store sales cumsum_sales
0 to 4 4
1 to 7 11
2 to 10 21
3 to 5 26
4 to 8 34
5 B 9 9
6 B 12 21
7 B 15 36
8 B 10 46
9 B 8 54
cumsum_sales 열에는 각 매장별로 그룹화된 누적 판매량이 표시됩니다.
참고 : 여기에서 pandas의 cumsum 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 특정 열을 합산하는 방법
Pandas의 조건에 따라 열을 합산하는 방법
팬더에서 역누적합을 계산하는 방법