Comment calculer la somme des colonnes dans Pandas
Souvent, vous pourriez être intéressé par calculer la somme d’une ou plusieurs colonnes dans un DataFrame pandas. Heureusement, vous pouvez le faire facilement dans les pandas en utilisant la fonction sum() .
Ce didacticiel montre plusieurs exemples d’utilisation de cette fonction.
Exemple 1 : Trouver la somme d’une seule colonne
Supposons que nous ayons le DataFrame pandas suivant :
import pandas as pd import numpy as np #create DataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 NaN 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
On peut trouver la somme de la colonne intitulée « points » en utilisant la syntaxe suivante :
df['points'].sum()
182
La fonction sum() exclura également les NA par défaut. Par exemple, si l’on retrouve la somme de la colonne « rebonds », la première valeur de « NaN » sera simplement exclue du calcul :
df['rebounds'].sum()
72.0
Exemple 2 : trouver la somme de plusieurs colonnes
Nous pouvons trouver la somme de plusieurs colonnes en utilisant la syntaxe suivante :
#find sum of points and rebounds columns df[['rebounds', 'points']].sum() rebounds 72.0 points 182.0 dtype: float64
Exemple 3 : trouver la somme de toutes les colonnes
On peut également trouver la somme de toutes les colonnes en utilisant la syntaxe suivante :
#find sum of all columns in DataFrame df.sum() rating 853.0 points 182.0 assists 68.0 rebounds 72.0 dtype: float64
Pour les colonnes qui ne sont pas numériques, la fonction sum() ne calculera tout simplement pas la somme de ces colonnes.
Vous pouvez trouver la documentation complète de la fonction sum() ici .