Come calcolare la somma delle colonne in pandas


Spesso potresti essere interessato a calcolare la somma di una o più colonne in un DataFrame panda. Fortunatamente, puoi farlo facilmente nei panda usando la funzione sum() .

Questo tutorial mostra diversi esempi di utilizzo di questa funzione.

Esempio 1: trova la somma di una singola colonna

Supponiamo di avere i seguenti panda DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

	rating points assists rebounds
0 90 25 5 NaN
1 85 20 7 8
2 82 14 7 10
3 88 16 8 6
4 94 27 5 6
5 90 20 7 9
6 76 12 6 6
7 75 15 9 10
8 87 14 9 10
9 86 19 5 7

Possiamo trovare la somma della colonna denominata “punti” utilizzando la seguente sintassi:

 df['points']. sum ()

182

La funzione sum() escluderà anche le NA per impostazione predefinita. Se ad esempio troviamo la somma della colonna “rimbalzi”, il primo valore di “NaN” verrà semplicemente escluso dal calcolo:

 df['rebounds']. sum ()

72.0

Esempio 2: trova la somma di più colonne

Possiamo trovare la somma di più colonne utilizzando la seguente sintassi:

 #find sum of points and rebounds columns
df[['rebounds', 'points']]. sum ()

rebounds 72.0
points 182.0
dtype:float64

Esempio 3: trova la somma di tutte le colonne

Possiamo anche trovare la somma di tutte le colonne utilizzando la seguente sintassi:

 #find sum of all columns in DataFrame
df. sum ()

rating 853.0
points 182.0
assists 68.0
rebounds 72.0
dtype:float64

Per le colonne che non sono numeriche, la funzione sum() semplicemente non calcolerà la somma di tali colonne.

Puoi trovare la documentazione completa della funzione sum() qui .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *