Pandas에서 이동 중앙값을 계산하는 방법: 예 포함


롤링 중앙값은 시계열에서 이전 기간 수의 중앙값입니다.

Pandas DataFrame에서 열의 이동 중앙값을 계산하려면 다음 구문을 사용할 수 있습니다.

 #calculate rolling median of previous 3 periods
df[' column_name ']. rolling (3). median ()

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예: 열의 이동 중앙값 계산

다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' month ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
                   ' leads ': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24],
                   ' sales ': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]})

#view DataFrame
df

	month sales leads
0 1 13 22
1 2 15 24
2 3 16 23
3 4 15 27
4 5 17 26
5 6 20 26
6 7 22 27
7 8 24 30
8 9 25 33
9 10 26 32
10 11 23 27
11 12 24 25

다음 구문을 사용하여 이전 3개 기간에 대한 “판매액”의 이동 중앙값을 포함하는 새 열을 만들 수 있습니다.

 #calculate 3-month rolling median
df[' sales_rolling3 '] = df[' sales ']. rolling (3). median ()

#view updated data frame
df

	month leads sales sales_rolling3
0 1 13 22 NaN
1 2 15 24 NaN
2 3 16 23 23.0
3 4 15 27 24.0
4 5 17 26 26.0
5 6 20 26 26.0
6 7 22 27 26.0
7 8 24 30 27.0
8 9 25 33 30.0
9 10 26 32 32.0
10 11 23 27 32.0
11 12 24 25 27.0

3개월 동안 표시된 롤링 중앙값 매출이 이전 3개월의 중앙값인지 수동으로 확인할 수 있습니다.

  • 22, 24, 23의 중앙값 = 23.0

마찬가지로 4개월차의 롤링 중앙값 판매량을 확인할 수 있습니다.

  • 24, 23, 27의 중앙값 = 24.0

비슷한 구문을 사용하여 6개월 이동 중앙값을 계산할 수 있습니다.

 #calculate 6-month rolling median
df[' sales_rolling6 '] = df[' sales ']. rolling (6). median ()

#view updated data frame
df

month leads sales sales_rolling3 sales_rolling6
0 1 13 22 NaN NaN
1 2 15 24 NaN NaN
2 3 16 23 23.0 NaN
3 4 15 27 24.0 NaN
4 5 17 26 26.0 NaN
5 6 20 26 26.0 25.0
6 7 22 27 26.0 26.0
7 8 24 30 27.0 26.5
8 9 25 33 30.0 27.0
9 10 26 32 32.0 28.5
10 11 23 27 32.0 28.5
11 12 24 25 27.0 28.5

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 이동 평균을 계산하는 방법
팬더에서 슬라이딩 상관 관계를 계산하는 방법
팬더의 변화율을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다