Panda's: hoe u unieke waarden uit de indexkolom kunt halen
U kunt de volgende methoden gebruiken om de unieke waarden van de indexkolom van een Panda DataFrame te verkrijgen:
Methode 1: Haal unieke waarden uit de indexkolom
df. index . single ()
Methode 2: Haal unieke waarden uit een specifieke kolom in MultiIndex
df. index . unique (' some_column ')
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Haal unieke waarden uit de indexkolom
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]}, index = [0, 1, 1, 1, 2, 2, 3, 4]) #view DataFrame print (df) team points assists 0 to 18 5 1 B 22 7 1 C 19 7 1 D 14 9 2 E 14 12 2 F 11 9 3 G 20 9 4:28 4
We kunnen de volgende syntaxis gebruiken om de unieke waarden van de indexkolom van het DataFrame te verkrijgen:
#get unique values from index column
df. index . single ()
Int64Index([0, 1, 2, 3, 4], dtype='int64')
De uitvoer toont elk van de unieke waarden in de indexkolom.
We kunnen ook de functie len() gebruiken om het aantal unieke waarden in de indexkolom te tellen:
#count number of unique values in index column
len ( df.index.unique ( ))
5
We kunnen zien dat er 5 unieke waarden zijn in de indexkolom van het DataFrame.
Voorbeeld 2: Haal unieke waarden uit een specifieke kolom in MultiIndex
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd #define index values index_names = pd. MultiIndex . from_tuples ([(' West ',' A '), (' West ', ' A '), (' West ', ' B '), (' East ', ' C '), (' East ', ' C '), (' East ', ' D ')], names=[' Division ', ' Team ']) #define data values data = {' Sales ': [12, 44, 29, 35, 44, 19]} #createDataFrame df = pd. DataFrame (data, index=index_names) #view DataFrame print (df) Sales Division Team West A 12 At 44 B29 East C 35 C 44 D 19
Merk op dat dit DataFrame een multiIndex heeft.
We kunnen de volgende syntaxis gebruiken om de unieke waarden van de enkele Team- kolom van de multiIndex te verkrijgen:
#get unique values from Team column in multiIndex
df. index . single (' Team ')
Index(['A', 'B', 'C', 'D'], dtype='object', name='Team')
De uitvoer toont de vier unieke waarden uit de kolom Team van de multiIndex: A, B, C en D.
We kunnen een vergelijkbare syntaxis gebruiken om unieke waarden uit de kolom Divisie van de multiIndex te extraheren:
#get unique values from Division column in multiIndex
df. index . single (' Division ')
Index(['West', 'East'], dtype='object', name='Division')
De uitvoer toont de twee unieke waarden van de kolom Divisie van de multiIndex: West en Oost.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:
Hoe index naar kolom te converteren in Pandas
Hoe de index in Panda’s te hernoemen
Hoe u een kolom instelt als index in Pandas