Comment additionner des colonnes spécifiques dans Pandas (avec exemples)



Vous pouvez utiliser les méthodes suivantes pour trouver la somme d’un ensemble spécifique de colonnes dans un DataFrame pandas :

Méthode 1 : trouver la somme de toutes les colonnes

#find sum of all columns
df['sum'] = df.sum(axis=1)

Méthode 2 : trouver la somme de colonnes spécifiques

#specify the columns to sum
cols = ['col1', 'col4', 'col5']

#find sum of columns specified 
df['sum'] = df[cols].sum(axis=1)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

   points  assists  rebounds
0      18        5        11
1      22        7         8
2      19        7        10
3      14        9         6
4      14       12         6
5      11        9         5
6      20        9         9
7      28        4        12

Exemple 1 : Trouver la somme de toutes les colonnes

Le code suivant montre comment additionner les valeurs des lignes dans toutes les colonnes du DataFrame :

#define new column that contains sum of all columns
df['sum_stats'] = df.sum(axis=1)

#view updated DataFrame
df

	points	assists	rebounds sum_stats
0	18	5	11	 34
1	22	7	8	 37
2	19	7	10	 36
3	14	9	6	 29
4	14	12	6	 32
5	11	9	5	 25
6	20	9	9	 38
7	28	4	12	 44

La colonne sum_stats contient la somme des valeurs de ligne dans toutes les colonnes.

Par exemple, voici comment les valeurs ont été calculées :

  • Somme de la ligne 0 : 18 + 5 + 11 = 34
  • Somme de la ligne 1 : 22 + 7 + 8 = 37
  • Somme de la ligne 2 : 19 + 7 + 10 = 36

Et ainsi de suite.

Exemple 2 : Trouver la somme de colonnes spécifiques

Le code suivant montre comment additionner les valeurs des lignes dans toutes les colonnes du DataFrame :

#specify the columns to sum
cols = ['points', 'assists']

#define new column that contains sum of specific columns
df['sum_stats'] = df[cols].sum(axis=1)

#view updated DataFrame
df

	points	assists	rebounds sum_stats
0	18	5	11	 23
1	22	7	8	 29
2	19	7	10	 26
3	14	9	6	 23
4	14	12	6	 26
5	11	9	5	 20
6	20	9	9	 29
7	28	4	12	 32

La colonne sum_stats contient la somme des valeurs de ligne dans les colonnes « points » et « passes décisives ».

Par exemple, voici comment les valeurs ont été calculées :

  • Somme de la ligne 0 : 18 + 5 + 11 = 23
  • Somme de la ligne 1 : 22 + 7 = 29
  • Somme de la ligne 2 : 19 + 7 = 26

Et ainsi de suite.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment exécuter une fonction SUMIF dans Pandas
Comment effectuer une somme GroupBy dans Pandas
Comment additionner des colonnes en fonction d’une condition dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *