Pandy: znajdź unikalne wartości w kolumnie i posortuj je
Możesz użyć poniższej podstawowej składni, aby znaleźć unikalne wartości w kolumnie pandy DataFrame, a następnie je posortować:
df[' my_column ']. drop_duplicates (). sort_values ()
Spowoduje to zwrócenie serii pand zawierającej każdą unikalną wartość w kolumnie posortowanej w kolejności rosnącej.
Aby posortować unikalne wartości w kolejności malejącej, użyj ascending=False :
df[' my_column ']. drop_duplicates (). sort_values (ascending= False )
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Znajdź unikalne wartości w kolumnie Pandy i posortuj je
Załóżmy, że mamy następującą ramkę DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]}) #view DataFrame print (df) team points 0 to 5 1 to 5 2 to 9 3 to 12 4 to 12 5 B 5 6 B 10 7 B 13 8 B 13 9 B 19
Możemy zastosować następującą składnię, aby uzyskać unikalne wartości kolumny punktów , a następnie posortować je w kolejności rosnącej:
#get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()
0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64
Dane wyjściowe wyświetlają każdą z unikalnych wartości w kolumnie punktów posortowaną w kolejności rosnącej:
- 5
- 9
- dziesięć
- 12
- 13
- 19
Możemy również uzyskać unikalne wartości w kolumnie punktów posortowane w kolejności malejącej, określając ascending=False w funkcji sort_values() :
#get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )
9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64
Dane wyjściowe wyświetlają każdą z unikalnych wartości w kolumnie punktów posortowaną w kolejności malejącej:
- 19
- 13
- 12
- dziesięć
- 9
- 5
Uwaga : pełną dokumentację funkcji drop_duplicates() pandy można znaleźć tutaj.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje w pandach:
Pandy: Jak wybrać pojedyncze wiersze w DataFrame
Pandy: Jak uzyskać unikalne wartości z kolumny indeksu
Pandy: jak liczyć unikalne kombinacje dwóch kolumn