Pandas : comment calculer une moyenne mobile par groupe



Vous pouvez utiliser la syntaxe de base suivante pour calculer une moyenne mobile par groupe chez les pandas :

#calculate 3-period moving average of 'values' by 'group'
df.groupby('group')['values'].transform(lambda x: x.rolling(3, 1).mean())

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : calculer la moyenne mobile par groupe dans Pandas

Supposons que nous ayons le DataFrame pandas suivant qui montre les ventes totales réalisées par deux magasins au cours de cinq périodes de vente :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'store': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   'period': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5],
                   'sales': [7, 7, 9, 13, 14, 13, 13, 19, 20, 26]})

#view DataFrame
df

	store	period	sales
0	A	1	7
1	A	2	7
2	A	3	9
3	A	4	13
4	A	5	14
5	B	1	13
6	B	2	13
7	B	3	19
8	B	4	20
9	B	5	26

Nous pouvons utiliser le code suivant pour calculer une moyenne mobile des ventes sur 3 jours pour chaque magasin :

#calculate 3-day moving average of sales by store
df['ma'] = df.groupby('store')['sales'].transform(lambda x: x.rolling(3, 1).mean())

#view updated DataFrame
df

        store	period	sales	ma
0	A	1	7	7.000000
1	A	2	7	7.000000
2	A	3	9	7.666667
3	A	4	13	9.666667
4	A	5	14	12.000000
5	B	1	13	13.000000
6	B	2	13	13.000000
7	B	3	19	15.000000
8	B	4	20	17.333333
9	B	5	26	21.666667

Remarque : x.rolling(3, 1) signifie calculer une moyenne mobile sur 3 périodes et exiger 1 comme nombre minimum de périodes.

La colonne « ma » affiche la moyenne mobile des ventes sur 3 jours pour chaque magasin.

Pour calculer une moyenne mobile différente, modifiez simplement la valeur dans la fonction Rolling() .

Par exemple, nous pourrions plutôt calculer la moyenne mobile des ventes sur 2 jours pour chaque magasin :

#calculate 2-day moving average of sales by store
df['ma'] = df.groupby('store')['sales'].transform(lambda x: x.rolling(2, 1).mean())

#view updated DataFrame
df

        store	period	sales	ma
0	A	1	7	7.0
1	A	2	7	7.0
2	A	3	9	8.0
3	A	4	13	11.0
4	A	5	14	13.5
5	B	1	13	13.0
6	B	2	13	13.0
7	B	3	19	16.0
8	B	4	20	19.5
9	B	5	26	23.0

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment effectuer une somme GroupBy dans Pandas
Comment compter les valeurs uniques à l’aide de GroupBy dans Pandas
Comment utiliser Groupby et Plot dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *