Pandas : Comment trouver des valeurs uniques dans une colonne



Le moyen le plus simple d’obtenir une liste de valeurs uniques dans une colonne Pandas DataFrame est d’utiliser la fonction unique() .

Ce didacticiel fournit plusieurs exemples d’utilisation de cette fonction avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'C'],
                   'conference': ['East', 'East', 'East', 'West', 'West', 'East'],
                   'points': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team	conference  points
0	A	East	    11
1	A	East	    8
2	A	East	    10
3	B	West	    6
4	B	West	    6
5	C	East	    5

Rechercher des valeurs uniques dans une colonne

Le code suivant montre comment trouver les valeurs uniques dans une seule colonne du DataFrame :

df.team.unique()

array(['A', 'B', 'C'], dtype=object)

Nous pouvons voir que les valeurs uniques dans la colonne d’équipe incluent « A », « B » et « C ».

Rechercher des valeurs uniques dans toutes les colonnes

Le code suivant montre comment trouver les valeurs uniques dans toutes les colonnes du DataFrame :

for col in df:
  print(df[col].unique())

['A' 'B' 'C']
['East' 'West']
[11  8 10  6  5]

Rechercher et trier des valeurs uniques dans une colonne

Le code suivant montre comment rechercher et trier par valeurs uniques dans une seule colonne du DataFrame :

#find unique points values
points = df.points.unique()

#sort values smallest to largest
points.sort()

#display sorted values
points

array([ 5,  6,  8, 10, 11])

Rechercher et compter les valeurs uniques dans une colonne

Le code suivant montre comment rechercher et compter l’occurrence de valeurs uniques dans une seule colonne du DataFrame :

df.team.value_counts()

A    3
B    2
C    1
Name: team, dtype: int64

Ressources additionnelles

Comment sélectionner des lignes uniques dans un DataFrame Pandas
Comment trouver des valeurs uniques dans plusieurs colonnes dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *