Pandas에서 시간별로 데이터를 그룹화하는 방법(예제 포함)


다음 구문을 사용하여 데이터를 시간별로 그룹화하고 Pandas에서 집계를 수행할 수 있습니다.

 df. groupby ([df[' time ']. dt . hour ]). dirty . sum ()

이 특정 예에서는 시간별 값을 Hour 라는 열로 그룹화한 다음 각 시간에 대한 Sales 열의 값 합계를 계산합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas에서 시간별로 데이터 그룹화

매장의 하루 중 다양한 시간대에 발생한 판매량을 표시하는 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' time ': ['2022-01-01 01:14:00', '2022-01-01 01:24:15',
                            '2022-01-01 02:52:19', '2022-01-01 02:54:00',
                            '2022-01-01 04:05:10', '2022-01-01 05:35:09'],
                   ' sales ': [18, 20, 15, 14, 10, 9]})

#convert date column to datetime
df[' time '] = pd. to_datetime (df[' time '])

#view DataFrame
print (df)

                 time sales
0 2022-01-01 01:14:00 18
1 2022-01-01 01:24:15 20
2 2022-01-01 02:52:19 15
3 2022-01-01 02:54:00 14
4 2022-01-01 04:05:10 10
5 2022-01-01 05:35:09 9

다음 구문을 사용하여 시간 열을 시간별로 그룹화하고 각 시간의 매출 합계를 계산할 수 있습니다.

 #group by hours in time column and calculate sum of sales
df. groupby ([df[' time ']. dt . hour ]). dirty . sum ()

time
1 38
2 29
4 10
5 9
Name: sales, dtype: int64

결과에서 우리는 다음을 볼 수 있습니다:

  • 첫 시간 동안 총 38개의 판매가 이루어졌습니다.
  • 두 번째 시간에는 총 29개의 판매가 이루어졌습니다.
  • 4시간 동안 총 10개의 판매가 이루어졌습니다.
  • 5시간 동안 총 9 개의 판매가 이루어졌습니다.

또 다른 집계를 수행할 수도 있습니다.

예를 들어 시간당 평균 판매량을 계산할 수 있습니다.

 #group by hours in time column and calculate mean of sales
df. groupby ([df[' time ']. dt . hour ]). dirty . mean ()

time
1 19.0
2 14.5
4 10.0
5 9.0
Name: sales, dtype: float64

원하는 경우 시간과 분별로 그룹화할 수도 있습니다.

예를 들어, 다음 코드는 판매 합계를 시간과 분별로 그룹화하여 계산하는 방법을 보여줍니다.

 #group by hours and minutes in time column and calculate mean of sales
df. groupby ([df[' time ']. dt . hour , df[' time ']. dt . minute ]). dirty . mean ()

time time
1 14 18
      24 20
2 52 15
      54 14
4 5 10
5 35 9
Name: sales, dtype: int64

결과에서 우리는 다음을 볼 수 있습니다:

  • 1시간 14분 동안 평균 판매 건수는 18건 이었다.
  • 1시간 23분 동안 평균 판매 건수는 20건 이었다.
  • 2시간 52분 동안 평균 판매횟수는 15회 였다.

등등.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 날짜 범위를 만드는 방법
Pandas에서 날짜로부터 월을 추출하는 방법
Pandas에서 타임스탬프를 날짜/시간으로 변환하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다