Pandas: 그룹당 누적 합계를 계산하는 방법


다음 구문을 사용하여 팬더에서 그룹당 누적 합계를 계산할 수 있습니다.

 df[' cumsum_col '] = df. groupby ([' col1 '])[' col2 ']. cumsum ()

이 특정 수식은 col1 로 그룹화된 col2 의 누적 합계를 계산하고 cumsum_col 이라는 새 열에 결과를 표시합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas에서 그룹당 누적 합계 계산

다양한 매장의 판매 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' sales ': [4, 7, 10, 5, 8, 9, 12, 15, 10, 8]})

#view DataFrame
print (df)

  blind sales
0 to 4
1 to 7
2 to 10
3 to 5
4 to 8
5 B 9
6 B 12
7 B 15
8 B 10
9 B 8

다음 구문을 사용하여 각 매장의 누적 매출 합계를 계산할 수 있습니다.

 #add column that shows cumulative sum of sales by store
df[' cumsum_sales '] = df. groupby ([' store '])[' sales ']. cumsum ()

#view updated DataFrame
print (df)

  store sales cumsum_sales
0 to 4 4
1 to 7 11
2 to 10 21
3 to 5 26
4 to 8 34
5 B 9 9
6 B 12 21
7 B 15 36
8 B 10 46
9 B 8 54

cumsum_sales 열에는 각 매장별로 그룹화된 누적 판매량이 표시됩니다.

참고 : 여기에서 pandas의 cumsum 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 특정 열을 합산하는 방법
Pandas의 조건에 따라 열을 합산하는 방법
팬더에서 역누적합을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다