팬더에서 5분 간격으로 그룹화하는 방법


다음 기본 구문을 사용하여 Pandas DataFrame에서 행을 5분 간격으로 그룹화할 수 있습니다.

 df. resample (' 5min '). sum ()

이 특정 공식은 DataFrame의 인덱스에 날짜/시간 값이 포함되어 있다고 가정하고 DataFrame의 각 열의 합계를 5분 간격으로 그룹화하여 계산합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

관련 항목: pandas의 resample() 소개

예: Pandas에서 5분 간격으로 그룹화하는 방법

다양한 날짜와 시간에 회사의 매출을 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2020 ', freq=' min ', periods= 12 ),
                   ' sales ': [6, 8, 9, 11, 13, 8, 8, 15, 22, 9, 8, 4],
                   ' returns ': [0, 3, 2, 2, 1, 3, 2, 4, 1, 5, 3, 2]})

#set 'date' column as index
df = df. set_index (' date ')

#view DataFrame
print (df)

                     sales returns
date                               
2020-01-01 00:00:00 6 0
2020-01-01 00:01:00 8 3
2020-01-01 00:02:00 9 2
2020-01-01 00:03:00 11 2
2020-01-01 00:04:00 13 1
2020-01-01 00:05:00 8 3
2020-01-01 00:06:00 8 2
2020-01-01 00:07:00 15 4
2020-01-01 00:08:00 22 1
2020-01-01 00:09:00 9 5
2020-01-01 00:10:00 8 3
2020-01-01 00:11:00 4 2

관련 항목:Pandas에서 날짜 범위를 만드는 방법

다음 구문을 사용하여 5분 간격으로 그룹화된 매출 합계를 계산할 수 있습니다.

 #calculate sum of sales and returns grouped by 5-minute intervals
df. resample (' 5min '). sum ()

                     sales returns
date		
2020-01-01 00:00:00 47 8
2020-01-01 00:05:00 62 15
2020-01-01 00:10:00 12 5

결과를 해석하는 방법은 다음과 같습니다.

  • 0~4분 동안의 총 판매량은 47 이었고 총 수익은 8 이었습니다.
  • 5~9분 동안의 총 매출은 62건 이었고 총 수익은 15건 이었습니다.
  • 10~14분 동안의 총 판매량은 1 2 이고 총 수익은 5 입니다.

유사한 구문을 사용하여 5분 간격으로 그룹화된 최대 판매 금액과 반품 금액을 계산할 수 있습니다.

 #calculate max of sales and max of returns grouped by 5-minute intervals
df. resample (' 5min '). max ()

	             sales returns
date		
2020-01-01 00:00:00 13 3
2020-01-01 00:05:00 22 5
2020-01-01 00:10:00 8 3

비슷한 구문을 사용하여 5분 간격으로 그룹화하려는 값을 계산할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

팬더 사이에서 날짜별로 그룹화하는 방법
팬더에서 주별로 그룹화하는 방법
Pandas에서 월별로 그룹화하는 방법
Pandas에서 분기별로 그룹화하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다