Pandas : comment calculer une moyenne mobile par groupe
Vous pouvez utiliser la syntaxe de base suivante pour calculer une moyenne mobile par groupe chez les pandas :
#calculate 3-period moving average of 'values' by 'group' df.groupby('group')['values'].transform(lambda x: x.rolling(3, 1).mean())
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : calculer la moyenne mobile par groupe dans Pandas
Supposons que nous ayons le DataFrame pandas suivant qui montre les ventes totales réalisées par deux magasins au cours de cinq périodes de vente :
import pandas as pd #create DataFrame df = pd.DataFrame({'store': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], 'period': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5], 'sales': [7, 7, 9, 13, 14, 13, 13, 19, 20, 26]}) #view DataFrame df store period sales 0 A 1 7 1 A 2 7 2 A 3 9 3 A 4 13 4 A 5 14 5 B 1 13 6 B 2 13 7 B 3 19 8 B 4 20 9 B 5 26
Nous pouvons utiliser le code suivant pour calculer une moyenne mobile des ventes sur 3 jours pour chaque magasin :
#calculate 3-day moving average of sales by store
df['ma'] = df.groupby('store')['sales'].transform(lambda x: x.rolling(3, 1).mean())
#view updated DataFrame
df
store period sales ma
0 A 1 7 7.000000
1 A 2 7 7.000000
2 A 3 9 7.666667
3 A 4 13 9.666667
4 A 5 14 12.000000
5 B 1 13 13.000000
6 B 2 13 13.000000
7 B 3 19 15.000000
8 B 4 20 17.333333
9 B 5 26 21.666667
Remarque : x.rolling(3, 1) signifie calculer une moyenne mobile sur 3 périodes et exiger 1 comme nombre minimum de périodes.
La colonne « ma » affiche la moyenne mobile des ventes sur 3 jours pour chaque magasin.
Pour calculer une moyenne mobile différente, modifiez simplement la valeur dans la fonction Rolling() .
Par exemple, nous pourrions plutôt calculer la moyenne mobile des ventes sur 2 jours pour chaque magasin :
#calculate 2-day moving average of sales by store
df['ma'] = df.groupby('store')['sales'].transform(lambda x: x.rolling(2, 1).mean())
#view updated DataFrame
df
store period sales ma
0 A 1 7 7.0
1 A 2 7 7.0
2 A 3 9 8.0
3 A 4 13 11.0
4 A 5 14 13.5
5 B 1 13 13.0
6 B 2 13 13.0
7 B 3 19 16.0
8 B 4 20 19.5
9 B 5 26 23.0
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment effectuer une somme GroupBy dans Pandas
Comment compter les valeurs uniques à l’aide de GroupBy dans Pandas
Comment utiliser Groupby et Plot dans Pandas