Comment trouver la valeur minimale par groupe chez Pandas



Vous pouvez utiliser les méthodes suivantes pour trouver la valeur minimale par groupe dans un DataFrame pandas :

Méthode 1 : Regrouper par minimum une colonne

df.groupby('group_column')['values_column'].min()

Méthode 2 : regrouper par minimum plusieurs colonnes

df.groupby('group_column')['values_column1', 'values_column2'].min()

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create pandas DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'C', 'C'],
                   'points':[24, 23, 27, 11, 14, 8, 13],
                   'rebounds': [11, 8, 7, 6, 6, 5, 12]})

#display DataFrame
print(df)

  team  points  rebounds
0    A      24        11
1    A      23         8
2    B      27         7
3    B      11         6
4    B      14         6
5    C       8         5
6    C      13        12

Exemple 1 : Grouper par minimum d’une colonne

Le code suivant montre comment trouver la valeur minimale de la colonne de points , regroupée par colonne d’équipe :

#find minimum value of points, grouped by team
df.groupby('team')['points'].min() 

team
A    23
B    11
C     8
Name: points, dtype: int64

À partir du résultat, nous pouvons voir :

  • La valeur minimale de points pour l’équipe A est de 23 .
  • La valeur minimale de points pour l’équipe B est de 11 .
  • La valeur minimale de points pour l’équipe C est de 8 .

Exemple 2 : Grouper par minimum de plusieurs colonnes

Le code suivant montre comment trouver la valeur minimale des colonnes de points et de rebonds , regroupées par colonne d’équipe :

#find minimum value of points and rebounds, grouped by team
df.groupby('team')[['points', 'rebounds']].min() 

    points  rebounds
team		
A	23	   8
B	11	   6
C	8	   5

À partir du résultat, nous pouvons voir :

Équipe A :

  • Points minimum : 23
  • Rebonds minimum : 8

Équipe B :

  • Points minimum : 11
  • Rebonds minimum : 6

Équipe C :

  • Points minimum : 8
  • Rebonds minimum : 5

Remarque : Il est important d’utiliser des doubles crochets lors de la spécification des colonnes de valeurs, sinon vous risquez de recevoir une erreur.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes chez les pandas :

Comment calculer la somme des colonnes dans Pandas
Comment calculer la moyenne des colonnes dans Pandas
Comment trouver la valeur maximale des colonnes dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *