Pandas에서 이동 중앙값을 계산하는 방법: 예 포함
롤링 중앙값은 시계열에서 이전 기간 수의 중앙값입니다.
Pandas DataFrame에서 열의 이동 중앙값을 계산하려면 다음 구문을 사용할 수 있습니다.
#calculate rolling median of previous 3 periods df[' column_name ']. rolling (3). median ()
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예: 열의 이동 중앙값 계산
다음과 같은 팬더 DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' month ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' leads ': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24], ' sales ': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]}) #view DataFrame df month sales leads 0 1 13 22 1 2 15 24 2 3 16 23 3 4 15 27 4 5 17 26 5 6 20 26 6 7 22 27 7 8 24 30 8 9 25 33 9 10 26 32 10 11 23 27 11 12 24 25
다음 구문을 사용하여 이전 3개 기간에 대한 “판매액”의 이동 중앙값을 포함하는 새 열을 만들 수 있습니다.
#calculate 3-month rolling median df[' sales_rolling3 '] = df[' sales ']. rolling (3). median () #view updated data frame df month leads sales sales_rolling3 0 1 13 22 NaN 1 2 15 24 NaN 2 3 16 23 23.0 3 4 15 27 24.0 4 5 17 26 26.0 5 6 20 26 26.0 6 7 22 27 26.0 7 8 24 30 27.0 8 9 25 33 30.0 9 10 26 32 32.0 10 11 23 27 32.0 11 12 24 25 27.0
3개월 동안 표시된 롤링 중앙값 매출이 이전 3개월의 중앙값인지 수동으로 확인할 수 있습니다.
- 22, 24, 23의 중앙값 = 23.0
마찬가지로 4개월차의 롤링 중앙값 판매량을 확인할 수 있습니다.
- 24, 23, 27의 중앙값 = 24.0
비슷한 구문을 사용하여 6개월 이동 중앙값을 계산할 수 있습니다.
#calculate 6-month rolling median df[' sales_rolling6 '] = df[' sales ']. rolling (6). median () #view updated data frame df month leads sales sales_rolling3 sales_rolling6 0 1 13 22 NaN NaN 1 2 15 24 NaN NaN 2 3 16 23 23.0 NaN 3 4 15 27 24.0 NaN 4 5 17 26 26.0 NaN 5 6 20 26 26.0 25.0 6 7 22 27 26.0 26.0 7 8 24 30 27.0 26.5 8 9 25 33 30.0 27.0 9 10 26 32 32.0 28.5 10 11 23 27 32.0 28.5 11 12 24 25 27.0 28.5
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 이동 평균을 계산하는 방법
팬더에서 슬라이딩 상관 관계를 계산하는 방법
팬더의 변화율을 계산하는 방법