Hoe de voortschrijdende mediaan in panda's te berekenen: met voorbeelden
Een voortschrijdende mediaan is de mediaan van een aantal voorgaande perioden in een tijdreeks.
Om de voortschrijdende mediaan van een kolom in een Panda DataFrame te berekenen, kunnen we de volgende syntaxis gebruiken:
#calculate rolling median of previous 3 periods df[' column_name ']. rolling (3). median ()
Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld: Bereken de bewegende mediaan van een kolom
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd #createDataFrame df = pd. DataFrame ({' month ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' leads ': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24], ' sales ': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]}) #view DataFrame df month sales leads 0 1 13 22 1 2 15 24 2 3 16 23 3 4 15 27 4 5 17 26 5 6 20 26 6 7 22 27 7 8 24 30 8 9 25 33 9 10 26 32 10 11 23 27 11 12 24 25
We kunnen de volgende syntaxis gebruiken om een nieuwe kolom te maken met de voortschrijdende mediaan van ‚verkoop‘ voor de voorgaande drie perioden:
#calculate 3-month rolling median df[' sales_rolling3 '] = df[' sales ']. rolling (3). median () #view updated data frame df month leads sales sales_rolling3 0 1 13 22 NaN 1 2 15 24 NaN 2 3 16 23 23.0 3 4 15 27 24.0 4 5 17 26 26.0 5 6 20 26 26.0 6 7 22 27 26.0 7 8 24 30 27.0 8 9 25 33 30.0 9 10 26 32 32.0 10 11 23 27 32.0 11 12 24 25 27.0
We kunnen handmatig verifiëren dat de voortschrijdende mediaan van de omzet die voor maand 3 wordt weergegeven, de mediaan van de voorgaande drie maanden is:
- Mediaan van 22, 24, 23 = 23,0
Op dezelfde manier kunnen we de voortschrijdende mediane omzet voor maand 4 controleren:
- Mediaan van 24, 23, 27 = 24,0
We kunnen een vergelijkbare syntaxis gebruiken om de voortschrijdende mediaan over zes maanden te berekenen:
#calculate 6-month rolling median df[' sales_rolling6 '] = df[' sales ']. rolling (6). median () #view updated data frame df month leads sales sales_rolling3 sales_rolling6 0 1 13 22 NaN NaN 1 2 15 24 NaN NaN 2 3 16 23 23.0 NaN 3 4 15 27 24.0 NaN 4 5 17 26 26.0 NaN 5 6 20 26 26.0 25.0 6 7 22 27 26.0 26.0 7 8 24 30 27.0 26.5 8 9 25 33 30.0 27.0 9 10 26 32 32.0 28.5 10 11 23 27 32.0 28.5 11 12 24 25 27.0 28.5
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe u een voortschrijdend gemiddelde in panda’s kunt berekenen
Hoe de glijdende correlatie bij panda’s te berekenen
Hoe de procentuele verandering bij panda’s te berekenen