Panda's: vind unieke waarden in de kolom en sorteer ze


U kunt de volgende basissyntaxis gebruiken om unieke waarden in een kolom van een panda’s DataFrame te vinden en deze vervolgens te sorteren:

 df[' my_column ']. drop_duplicates (). sort_values ()

Hierdoor wordt een pandareeks geretourneerd met elke unieke waarde in een kolom, gesorteerd in oplopende volgorde.

Om unieke waarden in aflopende volgorde te sorteren, gebruikt u oplopend=False :

 df[' my_column ']. drop_duplicates (). sort_values (ascending= False )

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Zoek unieke waarden in de Panda’s-kolom en sorteer ze

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]})

#view DataFrame
print (df)

  team points
0 to 5
1 to 5
2 to 9
3 to 12
4 to 12
5 B 5
6 B 10
7 B 13
8 B 13
9 B 19

We kunnen de volgende syntaxis gebruiken om de unieke waarden van de puntenkolom te verkrijgen en deze vervolgens in oplopende volgorde te sorteren:

 #get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()

0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64

De uitvoer toont elk van de unieke waarden in de puntkolom , gesorteerd in oplopende volgorde:

  • 5
  • 9
  • tien
  • 12
  • 13
  • 19

We kunnen de unieke waarden in de puntenkolom ook in aflopende volgorde laten sorteren door oplopend=False op te geven in de functie sort_values() :

 #get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )

9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64

De uitvoer toont elk van de unieke waarden in de puntkolom , gesorteerd in aflopende volgorde:

  • 19
  • 13
  • 12
  • tien
  • 9
  • 5

Opmerking : u kunt hier de volledige documentatie voor de pandas drop_duplicates() functie vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:

Panda’s: afzonderlijke rijen selecteren in DataFrame
Panda’s: unieke waarden uit de indexkolom halen
Panda’s: unieke combinaties van twee kolommen tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert