Comment calculer la médiane mobile chez les pandas : avec des exemples



Une médiane glissante est la médiane d’un certain nombre de périodes précédentes dans une série chronologique.

Pour calculer la médiane glissante d’une colonne dans un DataFrame pandas, nous pouvons utiliser la syntaxe suivante :

#calculate rolling median of previous 3 periods
df['column_name'].rolling(3).median()

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : Calculer la médiane mobile d’une colonne

Supposons que nous ayons le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'month': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
                   'leads': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24],
                   'sales': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]})

#view DataFrame
df

	month	leads	sales
0	1	13	22
1	2	15	24
2	3	16	23
3	4	15	27
4	5	17	26
5	6	20	26
6	7	22	27
7	8	24	30
8	9	25	33
9	10	26	32
10	11	23	27
11	12	24	25

Nous pouvons utiliser la syntaxe suivante pour créer une nouvelle colonne contenant la médiane glissante des « ventes » pour les 3 périodes précédentes :

#calculate 3-month rolling median
df['sales_rolling3'] = df['sales'].rolling(3).median()

#view updated data frame
df

	month	leads	sales	sales_rolling3
0	1	13	22	NaN
1	2	15	24	NaN
2	3	16	23	23.0
3	4	15	27	24.0
4	5	17	26	26.0
5	6	20	26	26.0
6	7	22	27	26.0
7	8	24	30	27.0
8	9	25	33	30.0
9	10	26	32	32.0
10	11	23	27	32.0
11	12	24	25	27.0

Nous pouvons vérifier manuellement que les ventes médianes glissantes affichées pour le mois 3 sont la médiane des 3 mois précédents :

  • Médiane de 22, 24, 23 = 23,0

De même, nous pouvons vérifier les ventes médianes glissantes du mois 4 :

  • Médiane de 24, 23, 27 = 24,0

Nous pouvons utiliser une syntaxe similaire pour calculer la médiane glissante sur 6 mois :

#calculate 6-month rolling median
df['sales_rolling6'] = df['sales'].rolling(6).median() 

#view updated data frame
df

month	leads	sales	sales_rolling3	sales_rolling6
0	1	13	22	NaN	NaN
1	2	15	24	NaN	NaN
2	3	16	23	23.0	NaN
3	4	15	27	24.0	NaN
4	5	17	26	26.0	NaN
5	6	20	26	26.0	25.0
6	7	22	27	26.0	26.0
7	8	24	30	27.0	26.5
8	9	25	33	30.0	27.0
9	10	26	32	32.0	28.5
10	11	23	27	32.0	28.5
11	12	24	25	27.0	28.5

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment calculer une moyenne mobile chez les pandas
Comment calculer la corrélation glissante chez les pandas
Comment calculer le pourcentage de changement chez les pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *