Comment calculer la moyenne des colonnes sélectionnées dans Pandas



Vous pouvez utiliser les méthodes suivantes pour calculer les valeurs moyennes des lignes pour les colonnes sélectionnées dans un DataFrame pandas :

Méthode 1 : calculer la valeur moyenne des lignes pour toutes les colonnes

df.mean(axis=1)

Méthode 2 : calculer la valeur moyenne des lignes pour des colonnes spécifiques

df[['col1', 'col3']].mean(axis=1)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'points': [14, 19, 9, 21, 25, 29, 20, 11],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	points	assists	rebounds
0	14	5	11
1	19	7	8
2	9	7	10
3	21	9	6
4	25	12	6
5	29	9	5
6	20	9	9
7	11	4	12

Méthode 1 : calculer la valeur moyenne des lignes pour toutes les colonnes

Le code suivant montre comment créer une nouvelle colonne dans le DataFrame qui affiche la valeur moyenne des lignes pour toutes les colonnes :

#define new column that shows the average row value for all columns
df['average_all'] = df.mean(axis=1)

#view updated DataFrame
df

	points	assists	rebounds  average_all
0	14	5	11	  10.000000
1	19	7	8	  11.333333
2	9	7	10	  8.666667
3	21	9	6	  12.000000
4	25	12	6	  14.333333
5	29	9	5	  14.333333
6	20	9	9	  12.666667
7	11	4	12	  9.000000

Voici comment interpréter le résultat :

La valeur moyenne de la première ligne est calculée comme suit : (14+5+11) / 3 = 10 .

La valeur moyenne de la deuxième ligne est calculée comme suit : (19+7+8) / 3 = 11,33 .

Et ainsi de suite.

Méthode 2 : calculer la valeur moyenne des lignes pour des colonnes spécifiques

Le code suivant montre comment calculer la valeur moyenne de la ligne uniquement pour les colonnes « points » et « rebonds » :

#define new column that shows average of row values for points and rebounds columns
df['avg_points_rebounds'] = df[['points', 'rebounds']].mean(axis=1)

#view updated DataFrame
df

        points	assists	rebounds  avg_points_rebounds
0	14	5	11	  12.5
1	19	7	8	  13.5
2	9	7	10	  9.5
3	21	9	6	  13.5
4	25	12	6	  15.5
5	29	9	5	  17.0
6	20	9	9	  14.5
7	11	4	12	  11.5

Voici comment interpréter le résultat :

La valeur moyenne des « points » et des « rebonds » dans la première ligne est calculée comme suit : (14+11) / 2 = 12,5 .

La valeur moyenne des « points » et des « rebonds » dans la deuxième ligne est calculée comme suit : (19+8) / 2 = 13,5 .

Et ainsi de suite.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes en Python :

Comment calculer une moyenne tronquée en Python
Comment calculer la moyenne géométrique en Python
Comment remplacer les valeurs dans la colonne Pandas en fonction de la condition

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *