Panda's: vind unieke waarden in de kolom en sorteer ze
U kunt de volgende basissyntaxis gebruiken om unieke waarden in een kolom van een panda’s DataFrame te vinden en deze vervolgens te sorteren:
df[' my_column ']. drop_duplicates (). sort_values ()
Hierdoor wordt een pandareeks geretourneerd met elke unieke waarde in een kolom, gesorteerd in oplopende volgorde.
Om unieke waarden in aflopende volgorde te sorteren, gebruikt u oplopend=False :
df[' my_column ']. drop_duplicates (). sort_values (ascending= False )
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Zoek unieke waarden in de Panda’s-kolom en sorteer ze
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]}) #view DataFrame print (df) team points 0 to 5 1 to 5 2 to 9 3 to 12 4 to 12 5 B 5 6 B 10 7 B 13 8 B 13 9 B 19
We kunnen de volgende syntaxis gebruiken om de unieke waarden van de puntenkolom te verkrijgen en deze vervolgens in oplopende volgorde te sorteren:
#get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()
0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64
De uitvoer toont elk van de unieke waarden in de puntkolom , gesorteerd in oplopende volgorde:
- 5
- 9
- tien
- 12
- 13
- 19
We kunnen de unieke waarden in de puntenkolom ook in aflopende volgorde laten sorteren door oplopend=False op te geven in de functie sort_values() :
#get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )
9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64
De uitvoer toont elk van de unieke waarden in de puntkolom , gesorteerd in aflopende volgorde:
- 19
- 13
- 12
- tien
- 9
- 5
Opmerking : u kunt hier de volledige documentatie voor de pandas drop_duplicates() functie vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:
Panda’s: afzonderlijke rijen selecteren in DataFrame
Panda’s: unieke waarden uit de indexkolom halen
Panda’s: unieke combinaties van twee kolommen tellen