Comment calculer la médiane chez les pandas (avec exemples)
Vous pouvez utiliser la fonction median() pour trouver la médiane d’une ou plusieurs colonnes dans un DataFrame pandas :
#find median value in specific column
df['column1'].median()
#find median value in several columns
df[['column1', 'column2']].median()
#find median value in every numeric column
df.median()
Les exemples suivants montrent comment utiliser cette fonction en pratique avec le DataFrame pandas suivant :
#create DataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
'points': [25, pd.NA, 15, 14, 19, 23, 25, 29],
'assists': [5, 7, 7, 9, 12, 9, 9, 4],
'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
df
player points assists rebounds
0 A 25 5 11
1 B NA 7 8
2 C 15 7 10
3 D 14 9 6
4 E 19 12 6
5 F 23 9 5
6 G 25 9 9
7 H 29 4 12
Exemple 1 : Trouver la médiane d’une seule colonne
Le code suivant montre comment trouver la valeur médiane d’une seule colonne dans un DataFrame pandas :
#find median value of points column
df['points'].median()
23.0
La valeur médiane dans la colonne des points est de 23 .
Notez que par défaut, la fonction median() ignore toutes les valeurs manquantes lors du calcul de la médiane.
Exemple 2 : Trouver la médiane de plusieurs colonnes
Le code suivant montre comment trouver la valeur médiane de plusieurs colonnes dans un DataFrame pandas :
#find median value of points and rebounds columns
df[['points', 'rebounds']].median()
points 23.0
rebounds 8.5
dtype: float64
Exemple 3 : Trouver la médiane de toutes les colonnes numériques
Le code suivant montre comment trouver la valeur médiane de toutes les colonnes numériques dans un DataFrame pandas :
#find median value of all numeric columns
df.median()
points 23.0
assists 8.0
rebounds 8.5
dtype: float64
Ressources additionnelles
Comment calculer la moyenne des colonnes dans Pandas
Comment calculer la somme des colonnes dans Pandas
Comment trouver la valeur maximale des colonnes dans Pandas