Comment calculer une somme cumulative inversée chez les pandas
La fonction cumsum() peut être utilisée pour calculer la somme cumulée des valeurs dans une colonne d’un DataFrame pandas.
Vous pouvez utiliser la syntaxe suivante pour calculer une somme cumulée inversée de valeurs dans une colonne :
df['cumsum_reverse'] = df.loc[::-1, 'my_column'].cumsum()[::-1]
Cette syntaxe particulière ajoute une nouvelle colonne appelée cumsum_reverse à un DataFrame pandas qui affiche la somme cumulée inversée des valeurs dans la colonne intitulée my_column .
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : calculer une somme cumulée inversée en pandas
Supposons que nous ayons le DataFrame pandas suivant qui montre les ventes totales réalisées par un magasin pendant 10 jours consécutifs :
import pandas as pd #create DataFrame df = pd.DataFrame({'day': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'sales': [3, 6, 0, 2, 4, 1, 0, 1, 4, 7]}) #view DataFrame df day sales 0 1 3 1 2 6 2 3 0 3 4 2 4 5 4 5 6 1 6 7 0 7 8 1 8 9 4 9 10 7
Nous pouvons utiliser la syntaxe suivante pour calculer une somme cumulée inversée de la colonne ventes :
#add new column that shows reverse cumulative sum of sales
df['cumsum_reverse_sales'] = df.loc[::-1, 'sales'].cumsum()[::-1]
#view updated DataFrame
df
day sales cumsum_reverse_sales
0 1 3 28
1 2 6 25
2 3 0 19
3 4 2 19
4 5 4 17
5 6 1 13
6 7 0 12
7 8 1 12
8 9 4 11
9 10 7 7
La nouvelle colonne intitulée cumsum_reverse_sales affiche les ventes cumulées à partir de la dernière ligne .
Voici comment nous interpréterions les valeurs de la colonne cumsum_reverse_sales :
- La somme cumulée des ventes pour le jour 10 est de 7 .
- La somme cumulée des ventes pour le jour 10 et le jour 9 est de 11 .
- La somme cumulée des ventes pour le jour 10, le jour 9 et le jour 8 est de 12 .
- La somme cumulée des ventes pour le jour 10, le jour 9, le jour 8 et le jour 7 est de 12 .
Et ainsi de suite.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Comment additionner des colonnes spécifiques dans Pandas
Comment effectuer une somme GroupBy dans Pandas
Comment additionner des colonnes en fonction d’une condition dans Pandas