Как рассчитать скользящую медиану в pandas: с примерами


Скользящая медиана — это медиана ряда предыдущих периодов во временном ряду.

Чтобы вычислить скользящую медиану столбца в DataFrame pandas, мы можем использовать следующий синтаксис:

 #calculate rolling median of previous 3 periods
df[' column_name ']. rolling (3). median ()

В следующем примере показано, как использовать эту функцию на практике.

Пример. Вычисление скользящей медианы столбца.

Предположим, у нас есть следующий DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' month ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
                   ' leads ': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24],
                   ' sales ': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]})

#view DataFrame
df

	month sales leads
0 1 13 22
1 2 15 24
2 3 16 23
3 4 15 27
4 5 17 26
5 6 20 26
6 7 22 27
7 8 24 30
8 9 25 33
9 10 26 32
10 11 23 27
11 12 24 25

Мы можем использовать следующий синтаксис, чтобы создать новый столбец, содержащий скользящую медиану «продаж» за предыдущие 3 периода:

 #calculate 3-month rolling median
df[' sales_rolling3 '] = df[' sales ']. rolling (3). median ()

#view updated data frame
df

	month leads sales sales_rolling3
0 1 13 22 NaN
1 2 15 24 NaN
2 3 16 23 23.0
3 4 15 27 24.0
4 5 17 26 26.0
5 6 20 26 26.0
6 7 22 27 26.0
7 8 24 30 27.0
8 9 25 33 30.0
9 10 26 32 32.0
10 11 23 27 32.0
11 12 24 25 27.0

Мы можем вручную проверить, что скользящий медианный объем продаж, отображаемый за третий месяц, является медианным за предыдущие 3 месяца:

  • Медиана 22, 24, 23 = 23,0

Аналогичным образом мы можем проверить скользящий медианный объем продаж за четвертый месяц:

  • Медиана 24, 23, 27 = 24,0

Мы можем использовать аналогичный синтаксис для расчета скользящей медианы за 6 месяцев:

 #calculate 6-month rolling median
df[' sales_rolling6 '] = df[' sales ']. rolling (6). median ()

#view updated data frame
df

month leads sales sales_rolling3 sales_rolling6
0 1 13 22 NaN NaN
1 2 15 24 NaN NaN
2 3 16 23 23.0 NaN
3 4 15 27 24.0 NaN
4 5 17 26 26.0 NaN
5 6 20 26 26.0 25.0
6 7 22 27 26.0 26.0
7 8 24 30 27.0 26.5
8 9 25 33 30.0 27.0
9 10 26 32 32.0 28.5
10 11 23 27 32.0 28.5
11 12 24 25 27.0 28.5

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как рассчитать скользящее среднее в Pandas
Как рассчитать скользящую корреляцию в пандах
Как рассчитать процентное изменение в пандах

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *