Come calcolare la somma delle colonne in pandas
Spesso potresti essere interessato a calcolare la somma di una o più colonne in un DataFrame panda. Fortunatamente, puoi farlo facilmente nei panda usando la funzione sum() .
Questo tutorial mostra diversi esempi di utilizzo di questa funzione.
Esempio 1: trova la somma di una singola colonna
Supponiamo di avere i seguenti panda DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 NaN 1 85 20 7 8 2 82 14 7 10 3 88 16 8 6 4 94 27 5 6 5 90 20 7 9 6 76 12 6 6 7 75 15 9 10 8 87 14 9 10 9 86 19 5 7
Possiamo trovare la somma della colonna denominata “punti” utilizzando la seguente sintassi:
df['points']. sum ()
182
La funzione sum() escluderà anche le NA per impostazione predefinita. Se ad esempio troviamo la somma della colonna “rimbalzi”, il primo valore di “NaN” verrà semplicemente escluso dal calcolo:
df['rebounds']. sum ()
72.0
Esempio 2: trova la somma di più colonne
Possiamo trovare la somma di più colonne utilizzando la seguente sintassi:
#find sum of points and rebounds columns df[['rebounds', 'points']]. sum () rebounds 72.0 points 182.0 dtype:float64
Esempio 3: trova la somma di tutte le colonne
Possiamo anche trovare la somma di tutte le colonne utilizzando la seguente sintassi:
#find sum of all columns in DataFrame df. sum () rating 853.0 points 182.0 assists 68.0 rebounds 72.0 dtype:float64
Per le colonne che non sono numeriche, la funzione sum() semplicemente non calcolerà la somma di tali colonne.
Puoi trovare la documentazione completa della funzione sum() qui .