Pandy: jak uzyskać unikalne wartości z kolumny indeksu
Możesz użyć następujących metod, aby uzyskać unikalne wartości kolumny indeksu pandy DataFrame:
Metoda 1: Uzyskaj unikalne wartości z kolumny indeksu
df. index . single ()
Metoda 2: Uzyskaj unikalne wartości z określonej kolumny w MultiIndex
df. index . unique (' some_column ')
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Uzyskaj unikalne wartości z kolumny indeksu
Załóżmy, że mamy następującą ramkę DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}, index = [0, 1, 1, 1, 2, 2, 3, 4]) #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 1 C 19 7 1 D 14 9 2 E 14 12 2 F 11 9 3 G 20 9 4:28 4
Aby uzyskać unikalne wartości kolumny indeksu DataFrame, możemy zastosować następującą składnię:
#get unique values from index column
df. index . single ()
Int64Index([0, 1, 2, 3, 4], dtype='int64')
Dane wyjściowe wyświetlają każdą z unikalnych wartości w kolumnie indeksu.
Możemy także użyć funkcji len() do zliczenia liczby unikalnych wartości w kolumnie indeksu:
#count number of unique values in index column
len ( df.index.unique ( ))
5
Widzimy, że w kolumnie indeksu DataFrame znajduje się 5 unikalnych wartości.
Przykład 2: Uzyskaj unikalne wartości z konkretnej kolumny w MultiIndex
Załóżmy, że mamy następującą ramkę DataFrame pand:
import pandas as pd #define index values index_names = pd. MultiIndex . from_tuples ([(' West ',' A '), (' West ', ' A '), (' West ', ' B '), (' East ', ' C '), (' East ', ' C '), (' East ', ' D ')], names=[' Division ', ' Team ']) #define data values data = {' Sales ': [12, 44, 29, 35, 44, 19]} #createDataFrame df = pd. DataFrame (data, index=index_names) #view DataFrame print (df) Sales Division Team West A 12 At 44 B29 East C 35 C 44 D 19
Należy pamiętać, że ta ramka DataFrame ma multiIndex.
Możemy użyć następującej składni, aby uzyskać unikalne wartości pojedynczej kolumny Team w multiIndex:
#get unique values from Team column in multiIndex
df. index . single (' Team ')
Index(['A', 'B', 'C', 'D'], dtype='object', name='Team')
Dane wyjściowe wyświetlają cztery unikalne wartości z kolumny Team multiIndexu: A, B, C i D.
Podobną składnię możemy zastosować do wyodrębnienia unikalnych wartości z kolumny Dzielenie multiIndexu:
#get unique values from Division column in multiIndex
df. index . single (' Division ')
Index(['West', 'East'], dtype='object', name='Division')
Dane wyjściowe wyświetlają dwie unikalne wartości kolumny Division multiIndex: West i East.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje w pandach:
Jak przekonwertować indeks na kolumnę w Pandach
Jak zmienić nazwę indeksu w Pandas
Jak ustawić kolumnę jako indeks w Pandach