Come trovare la somma delle righe in un pandas dataframe


Spesso potresti essere interessato a calcolare la somma di una o più righe in un DataFrame panda. Fortunatamente, puoi farlo facilmente nei panda usando la funzione sum(axis=1) .

Questo tutorial mostra diversi esempi di utilizzo di questa funzione sul seguente DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [8, np.nan, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df


        rating points assists rebounds
0 90 25 5 8.0
1 85 20 7 NaN
2 82 14 7 10.0
3 88 16 8 6.0
4 94 27 5 6.0
5 90 20 7 9.0
6 76 12 6 6.0
7 75 15 9 10.0
8 87 14 9 10.0
9 86 19 5 7.07

Esempio 1: trova la somma di ogni riga

Possiamo trovare la somma di ogni riga del DataFrame utilizzando la seguente sintassi:

 df. sum (axis=1)

0 128.0
1,112.0
2,113.0
3 118.0
4,132.0
5,126.0
6 100.0
7 109.0
8 120.0
9 117.0
dtype:float64

L’output ci dice:

  • La somma dei valori nella prima riga è 128 .
  • La somma dei valori nella seconda riga è 112 .
  • La somma dei valori nella terza riga è 113 .

E così via.

Esempio 2: posiziona le somme delle righe in una nuova colonna

Possiamo utilizzare il seguente codice per aggiungere una colonna al nostro DataFrame per contenere le somme delle righe:

 #define new DataFrame column 'row_sum' as the sum of each row
df['row_sum'] = df. sum (axis=1)

#view DataFrame
df

rating points assists rebounds row_sum
0 90 25 5 8.0 128.0
1 85 20 7 NaN 112.0
2 82 14 7 10.0 113.0
3 88 16 8 6.0 118.0
4 94 27 5 6.0 132.0
5 90 20 7 9.0 126.0
6 76 12 6 6.0 100.0
7 75 15 9 10.0 109.0
8 87 14 9 10.0 120.0
9 86 19 5 7.0 117.0

Esempio 3: trovare le somme delle righe per un breve elenco di colonne specifiche

Possiamo utilizzare il seguente codice per trovare la somma delle righe per un breve elenco di colonne specifiche:

 #define new DataFrame column as sum of points and assists columns
df['sum_pa'] = df['points'] + df['assists']

#view DataFrame
df

	rating points assists rebounds sum_pa
0 90 25 5 8.0 30
1 85 20 7 NaN 27
2 82 14 7 10.0 21
3 88 16 8 6.0 24
4 94 27 5 6.0 32
5 90 20 7 9.0 27
6 76 12 6 6.0 18
7 75 15 9 10.0 24
8 87 14 9 10.0 23
9 86 19 5 7.0 24

Esempio 4: trova le somme di riga per un lungo elenco di colonne specifiche

Possiamo utilizzare il seguente codice per trovare la somma delle righe per un elenco più lungo di colonne specifiche:

 #define col_list as a list of all DataFrame column names
col_list=list(df)

#remove the column 'rating' from the list
col_list.remove('rating')

#define new DataFrame column as sum of rows in col_list 
df['new_sum'] = df[col_list]. sum (axis=1)

#view DataFrame
df

        rating points assists rebounds new_sum
0 90 25 5 8.0 38.0
1 85 20 7 NaN 27.0
2 82 14 7 10.0 31.0
3 88 16 8 6.0 30.0
4 94 27 5 6.0 38.0
5 90 20 7 9.0 36.0
6 76 12 6 6.0 24.0
7 75 15 9 10.0 34.0
8 87 14 9 10.0 33.0
9 86 19 5 7.0 31.0

Puoi trovare la documentazione completa della funzione pandas sum() qui .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *