So berechnen sie den gleitenden median in pandas: mit beispielen
Ein gleitender Median ist der Median einer Reihe früherer Perioden in einer Zeitreihe.
Um den rollierenden Median einer Spalte in einem Pandas-DataFrame zu berechnen, können wir die folgende Syntax verwenden:
#calculate rolling median of previous 3 periods df[' column_name ']. rolling (3). median ()
Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel: Berechnen Sie den gleitenden Median einer Spalte
Angenommen, wir haben den folgenden Pandas-DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' month ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' leads ': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24], ' sales ': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]}) #view DataFrame df month sales leads 0 1 13 22 1 2 15 24 2 3 16 23 3 4 15 27 4 5 17 26 5 6 20 26 6 7 22 27 7 8 24 30 8 9 25 33 9 10 26 32 10 11 23 27 11 12 24 25
Mit der folgenden Syntax können wir eine neue Spalte erstellen, die den gleitenden Median der „Umsätze“ für die letzten drei Zeiträume enthält:
#calculate 3-month rolling median df[' sales_rolling3 '] = df[' sales ']. rolling (3). median () #view updated data frame df month leads sales sales_rolling3 0 1 13 22 NaN 1 2 15 24 NaN 2 3 16 23 23.0 3 4 15 27 24.0 4 5 17 26 26.0 5 6 20 26 26.0 6 7 22 27 26.0 7 8 24 30 27.0 8 9 25 33 30.0 9 10 26 32 32.0 10 11 23 27 32.0 11 12 24 25 27.0
Wir können manuell überprüfen, ob der für Monat 3 angezeigte gleitende Median der Verkäufe dem Median der letzten drei Monate entspricht:
- Median von 22, 24, 23 = 23,0
Ebenso können wir den rollierenden Median der Verkäufe für Monat 4 überprüfen:
- Median von 24, 23, 27 = 24,0
Wir können eine ähnliche Syntax verwenden, um den gleitenden 6-Monats-Median zu berechnen:
#calculate 6-month rolling median df[' sales_rolling6 '] = df[' sales ']. rolling (6). median () #view updated data frame df month leads sales sales_rolling3 sales_rolling6 0 1 13 22 NaN NaN 1 2 15 24 NaN NaN 2 3 16 23 23.0 NaN 3 4 15 27 24.0 NaN 4 5 17 26 26.0 NaN 5 6 20 26 26.0 25.0 6 7 22 27 26.0 26.0 7 8 24 30 27.0 26.5 8 9 25 33 30.0 27.0 9 10 26 32 32.0 28.5 10 11 23 27 32.0 28.5 11 12 24 25 27.0 28.5
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So berechnen Sie einen gleitenden Durchschnitt in Pandas
So berechnen Sie die gleitende Korrelation bei Pandas
So berechnen Sie die prozentuale Veränderung bei Pandas