Pandy: znajdź unikalne wartości w kolumnie i posortuj je


Możesz użyć poniższej podstawowej składni, aby znaleźć unikalne wartości w kolumnie pandy DataFrame, a następnie je posortować:

 df[' my_column ']. drop_duplicates (). sort_values ()

Spowoduje to zwrócenie serii pand zawierającej każdą unikalną wartość w kolumnie posortowanej w kolejności rosnącej.

Aby posortować unikalne wartości w kolejności malejącej, użyj ascending=False :

 df[' my_column ']. drop_duplicates (). sort_values (ascending= False )

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Znajdź unikalne wartości w kolumnie Pandy i posortuj je

Załóżmy, że mamy następującą ramkę DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]})

#view DataFrame
print (df)

  team points
0 to 5
1 to 5
2 to 9
3 to 12
4 to 12
5 B 5
6 B 10
7 B 13
8 B 13
9 B 19

Możemy zastosować następującą składnię, aby uzyskać unikalne wartości kolumny punktów , a następnie posortować je w kolejności rosnącej:

 #get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()

0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64

Dane wyjściowe wyświetlają każdą z unikalnych wartości w kolumnie punktów posortowaną w kolejności rosnącej:

  • 5
  • 9
  • dziesięć
  • 12
  • 13
  • 19

Możemy również uzyskać unikalne wartości w kolumnie punktów posortowane w kolejności malejącej, określając ascending=False w funkcji sort_values() :

 #get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )

9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64

Dane wyjściowe wyświetlają każdą z unikalnych wartości w kolumnie punktów posortowaną w kolejności malejącej:

  • 19
  • 13
  • 12
  • dziesięć
  • 9
  • 5

Uwaga : pełną dokumentację funkcji drop_duplicates() pandy można znaleźć tutaj.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje w pandach:

Pandy: Jak wybrać pojedyncze wiersze w DataFrame
Pandy: Jak uzyskać unikalne wartości z kolumny indeksu
Pandy: jak liczyć unikalne kombinacje dwóch kolumn

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *