Pandas : recherchez des valeurs uniques dans la colonne et triez-les



Vous pouvez utiliser la syntaxe de base suivante pour rechercher les valeurs uniques dans une colonne d’un DataFrame pandas, puis les trier :

df['my_column'].drop_duplicates().sort_values()

Cela renverra une série pandas contenant chaque valeur unique dans une colonne triée par ordre croissant.

Pour trier les valeurs uniques par ordre décroissant, utilisez ascending=False :

df['my_column'].drop_duplicates().sort_values(ascending=False)

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : recherchez des valeurs uniques dans la colonne Pandas et triez-les

Supposons que nous ayons le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   'points': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]})

#view DataFrame
print(df)

  team  points
0    A       5
1    A       5
2    A       9
3    A      12
4    A      12
5    B       5
6    B      10
7    B      13
8    B      13
9    B      19

Nous pouvons utiliser la syntaxe suivante pour obtenir les valeurs uniques de la colonne de points , puis les trier par ordre croissant :

#get unique values in points column and sort them
df['points'].drop_duplicates().sort_values()

0     5
2     9
6    10
3    12
7    13
9    19
Name: points, dtype: int64

La sortie affiche chacune des valeurs uniques dans la colonne de points triées par ordre croissant :

  • 5
  • 9
  • dix
  • 12
  • 13
  • 19

Nous pouvons également obtenir les valeurs uniques dans la colonne des points triées par ordre décroissant en spécifiant ascending=False dans la fonction sort_values() :

#get unique values in points column and sort them in descending order
df['points'].drop_duplicates().sort_values(ascending=False)

9    19
7    13
3    12
6    10
2     9
0     5
Name: points, dtype: int64

La sortie affiche chacune des valeurs uniques dans la colonne de points triées par ordre décroissant :

  • 19
  • 13
  • 12
  • dix
  • 9
  • 5

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas drop_duplicates() ici.

Ressources additionnelles

Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes dans les pandas :

Pandas : Comment sélectionner des lignes uniques dans DataFrame
Pandas : Comment obtenir des valeurs uniques à partir de la colonne d’index
Pandas : comment compter les combinaisons uniques de deux colonnes

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *