Pandy: jak znaleźć unikalne wartości w kolumnie
Najłatwiejszym sposobem uzyskania listy unikalnych wartości w kolumnie Pandas DataFrame jest użycie funkcji Unique() .
W tym samouczku przedstawiono kilka przykładów użycia tej funkcji z następującą ramką DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Znajdź unikalne wartości w kolumnie
Poniższy kod pokazuje, jak znaleźć unikalne wartości w pojedynczej kolumnie DataFrame:
df. team . single () array(['A', 'B', 'C'], dtype=object)
Widzimy, że unikalne wartości w kolumnie zespołu obejmują „A”, „B” i „C”.
Znajdź unikalne wartości we wszystkich kolumnach
Poniższy kod pokazuje, jak znaleźć unikalne wartości we wszystkich kolumnach DataFrame:
for col in df: print (df[col] .unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
Znajdź i posortuj unikalne wartości w kolumnie
Poniższy kod pokazuje jak wyszukiwać i sortować według unikalnych wartości w pojedynczej kolumnie DataFrame:
#find unique points values points = df. points . single () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11])
Znajdź i zlicz unikalne wartości w kolumnie
Poniższy kod pokazuje, jak znaleźć i policzyć występowanie unikalnych wartości w pojedynczej kolumnie DataFrame:
df. team . value_counts () At 3 B2 C 1 Name: team, dtype: int64
Dodatkowe zasoby
Jak wybrać pojedyncze wiersze w ramce danych Pandas
Jak znaleźć unikalne wartości w wielu kolumnach w Pandach