Pandas dataframe에서 분기별로 그룹화하는 방법(예제 포함)


다음 기본 구문을 사용하여 Pandas DataFrame에서 분기별로 행을 그룹화할 수 있습니다.

 #convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])

#calculate sum of values, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' values ']. sum ()

이 특정 수식은 날짜 열의 행을 분기별로 그룹화하고 DataFrame의 열 합계를 계산합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas에서 분기별로 그룹화하는 방법

다양한 날짜에 회사의 매출을 보여주는 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd. date_range (start='1/1/2022', freq='M', periods= 12 ),
                   ' sales ': [6, 8, 10, 5, 4, 8, 8, 3, 5, 14, 8, 3]})

#view DataFrame
print (df)

         dirty date
0 2022-01-31 6
1 2022-02-28 8
2 2022-03-31 10
3 2022-04-30 5
4 2022-05-31 4
5 2022-06-30 8
6 2022-07-31 8
7 2022-08-31 3
8 2022-09-30 5
9 2022-10-31 14
10 2022-11-30 8
11 2022-12-31 3

관련 항목:Pandas에서 날짜 범위를 만드는 방법

다음 구문을 사용하여 분기별로 그룹화된 매출 합계를 계산할 수 있습니다.

 #convert date column to datetime and subtract one week
df[' date '] = pd. to_datetime (df[' date '])

#calculate sum of sales, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. sum ()

date
2022Q1 24
2022Q2 17
2022Q3 16
2022Q4 25
Freq: Q-DEC, Name: sales, dtype: int64

결과를 해석하는 방법은 다음과 같습니다.

  • 1분기에는 총 24 건의 매출이 발생했다.
  • 2분기에는 총 17 건의 매출이 발생했다.
  • 3분기에는 총 16 건의 매출이 발생했다.
  • 4분기에는 총 25 건의 매출이 발생했다.

유사한 구문을 사용하여 분기별로 그룹화된 다른 측정항목을 계산할 수 있습니다.

예를 들어 분기별로 그룹화하여 최대 판매액을 계산할 수 있습니다.

 #convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])

#calculate max of sales, grouped by quarter
df. groupby (df[' date ']. dt . to_period (' Q '))[' sales ']. max ()

date
2022Q1 10
2022Q2 8
2022Q3 8
2022Q4 14
Freq: Q-DEC, Name: sales, dtype: int64

결과를 해석하는 방법은 다음과 같습니다.

  • 1분기 중 월간 최대 매출은 10 이었습니다.
  • 2분기의 월간 최대 매출은 8건 이었습니다.
  • 3분기의 월간 최대 매출은 8건 이었습니다.
  • 4분기의 월간 최대 매출은 14건 이었습니다.

참고 : 여기에서 pandas의 groupby 작업에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas DataFrame에서 월별로 그룹화하는 방법
Pandas DataFrame에서 주별로 그룹화하는 방법
Pandas: Groupby를 사용하고 조건부로 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다