Hoe de voortschrijdende mediaan in panda's te berekenen: met voorbeelden


Een voortschrijdende mediaan is de mediaan van een aantal voorgaande perioden in een tijdreeks.

Om de voortschrijdende mediaan van een kolom in een Panda DataFrame te berekenen, kunnen we de volgende syntaxis gebruiken:

 #calculate rolling median of previous 3 periods
df[' column_name ']. rolling (3). median ()

Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld: Bereken de bewegende mediaan van een kolom

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' month ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
                   ' leads ': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24],
                   ' sales ': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]})

#view DataFrame
df

	month sales leads
0 1 13 22
1 2 15 24
2 3 16 23
3 4 15 27
4 5 17 26
5 6 20 26
6 7 22 27
7 8 24 30
8 9 25 33
9 10 26 32
10 11 23 27
11 12 24 25

We kunnen de volgende syntaxis gebruiken om een nieuwe kolom te maken met de voortschrijdende mediaan van ‚verkoop‘ voor de voorgaande drie perioden:

 #calculate 3-month rolling median
df[' sales_rolling3 '] = df[' sales ']. rolling (3). median ()

#view updated data frame
df

	month leads sales sales_rolling3
0 1 13 22 NaN
1 2 15 24 NaN
2 3 16 23 23.0
3 4 15 27 24.0
4 5 17 26 26.0
5 6 20 26 26.0
6 7 22 27 26.0
7 8 24 30 27.0
8 9 25 33 30.0
9 10 26 32 32.0
10 11 23 27 32.0
11 12 24 25 27.0

We kunnen handmatig verifiëren dat de voortschrijdende mediaan van de omzet die voor maand 3 wordt weergegeven, de mediaan van de voorgaande drie maanden is:

  • Mediaan van 22, 24, 23 = 23,0

Op dezelfde manier kunnen we de voortschrijdende mediane omzet voor maand 4 controleren:

  • Mediaan van 24, 23, 27 = 24,0

We kunnen een vergelijkbare syntaxis gebruiken om de voortschrijdende mediaan over zes maanden te berekenen:

 #calculate 6-month rolling median
df[' sales_rolling6 '] = df[' sales ']. rolling (6). median ()

#view updated data frame
df

month leads sales sales_rolling3 sales_rolling6
0 1 13 22 NaN NaN
1 2 15 24 NaN NaN
2 3 16 23 23.0 NaN
3 4 15 27 24.0 NaN
4 5 17 26 26.0 NaN
5 6 20 26 26.0 25.0
6 7 22 27 26.0 26.0
7 8 24 30 27.0 26.5
8 9 25 33 30.0 27.0
9 10 26 32 32.0 28.5
10 11 23 27 32.0 28.5
11 12 24 25 27.0 28.5

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe u een voortschrijdend gemiddelde in panda’s kunt berekenen
Hoe de glijdende correlatie bij panda’s te berekenen
Hoe de procentuele verandering bij panda’s te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert