Pandas : Comment trouver des valeurs uniques dans une colonne
Le moyen le plus simple d’obtenir une liste de valeurs uniques dans une colonne Pandas DataFrame est d’utiliser la fonction unique() .
Ce didacticiel fournit plusieurs exemples d’utilisation de cette fonction avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'C'], 'conference': ['East', 'East', 'East', 'West', 'West', 'East'], 'points': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Rechercher des valeurs uniques dans une colonne
Le code suivant montre comment trouver les valeurs uniques dans une seule colonne du DataFrame :
df.team.unique() array(['A', 'B', 'C'], dtype=object)
Nous pouvons voir que les valeurs uniques dans la colonne d’équipe incluent « A », « B » et « C ».
Rechercher des valeurs uniques dans toutes les colonnes
Le code suivant montre comment trouver les valeurs uniques dans toutes les colonnes du DataFrame :
for col in df: print(df[col].unique()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
Rechercher et trier des valeurs uniques dans une colonne
Le code suivant montre comment rechercher et trier par valeurs uniques dans une seule colonne du DataFrame :
#find unique points values points = df.points.unique() #sort values smallest to largest points.sort() #display sorted values points array([ 5, 6, 8, 10, 11])
Rechercher et compter les valeurs uniques dans une colonne
Le code suivant montre comment rechercher et compter l’occurrence de valeurs uniques dans une seule colonne du DataFrame :
df.team.value_counts() A 3 B 2 C 1 Name: team, dtype: int64
Ressources additionnelles
Comment sélectionner des lignes uniques dans un DataFrame Pandas
Comment trouver des valeurs uniques dans plusieurs colonnes dans Pandas