Pandas : recherchez des valeurs uniques dans la colonne et triez-les
Vous pouvez utiliser la syntaxe de base suivante pour rechercher les valeurs uniques dans une colonne d’un DataFrame pandas, puis les trier :
df['my_column'].drop_duplicates().sort_values()
Cela renverra une série pandas contenant chaque valeur unique dans une colonne triée par ordre croissant.
Pour trier les valeurs uniques par ordre décroissant, utilisez ascending=False :
df['my_column'].drop_duplicates().sort_values(ascending=False)
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : recherchez des valeurs uniques dans la colonne Pandas et triez-les
Supposons que nous ayons le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], 'points': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]}) #view DataFrame print(df) team points 0 A 5 1 A 5 2 A 9 3 A 12 4 A 12 5 B 5 6 B 10 7 B 13 8 B 13 9 B 19
Nous pouvons utiliser la syntaxe suivante pour obtenir les valeurs uniques de la colonne de points , puis les trier par ordre croissant :
#get unique values in points column and sort them
df['points'].drop_duplicates().sort_values()
0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64
La sortie affiche chacune des valeurs uniques dans la colonne de points triées par ordre croissant :
- 5
- 9
- dix
- 12
- 13
- 19
Nous pouvons également obtenir les valeurs uniques dans la colonne des points triées par ordre décroissant en spécifiant ascending=False dans la fonction sort_values() :
#get unique values in points column and sort them in descending order
df['points'].drop_duplicates().sort_values(ascending=False)
9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64
La sortie affiche chacune des valeurs uniques dans la colonne de points triées par ordre décroissant :
- 19
- 13
- 12
- dix
- 9
- 5
Remarque : Vous pouvez trouver la documentation complète de la fonction pandas drop_duplicates() ici.
Ressources additionnelles
Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes dans les pandas :
Pandas : Comment sélectionner des lignes uniques dans DataFrame
Pandas : Comment obtenir des valeurs uniques à partir de la colonne d’index
Pandas : comment compter les combinaisons uniques de deux colonnes