Panda's: unieke waarden in een kolom vinden
De eenvoudigste manier om een lijst met unieke waarden in een Pandas DataFrame-kolom te krijgen, is door de functie unique() te gebruiken.
Deze zelfstudie biedt verschillende voorbeelden van het gebruik van deze functie met de volgende panda’s DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Zoek unieke waarden in een kolom
De volgende code laat zien hoe u unieke waarden kunt vinden in een enkele kolom van het DataFrame:
df. team . single () array(['A', 'B', 'C'], dtype=object)
We kunnen zien dat de unieke waarden in de teamkolom ‚A‘, ‚B‘ en ‚C‘ omvatten.
Vind unieke waarden in alle kolommen
De volgende code laat zien hoe u unieke waarden kunt vinden in alle kolommen van het DataFrame:
for col in df: print (df[col] .unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
Zoek en sorteer unieke waarden in een kolom
De volgende code laat zien hoe u kunt zoeken en sorteren op unieke waarden in een enkele kolom van het DataFrame:
#find unique points values points = df. points . single () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11])
Zoek en tel unieke waarden in een kolom
De volgende code laat zien hoe u het voorkomen van unieke waarden in een enkele kolom van het DataFrame kunt vinden en tellen:
df. team . value_counts () At 3 B2 C 1 Name: team, dtype: int64
Aanvullende bronnen
Hoe u afzonderlijke rijen selecteert in een Pandas DataFrame
Hoe unieke waarden in meerdere kolommen in Panda’s te vinden