Panda's: hoe u unieke waarden uit de indexkolom kunt halen


U kunt de volgende methoden gebruiken om de unieke waarden van de indexkolom van een Panda DataFrame te verkrijgen:

Methode 1: Haal unieke waarden uit de indexkolom

 df. index . single ()

Methode 2: Haal unieke waarden uit een specifieke kolom in MultiIndex

 df. index . unique (' some_column ')

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Haal unieke waarden uit de indexkolom

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]},
                   index = [0, 1, 1, 1, 2, 2, 3, 4])

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
1 C 19 7
1 D 14 9
2 E 14 12
2 F 11 9
3 G 20 9
4:28 4

We kunnen de volgende syntaxis gebruiken om de unieke waarden van de indexkolom van het DataFrame te verkrijgen:

 #get unique values from index column 
df. index . single ()

Int64Index([0, 1, 2, 3, 4], dtype='int64')

De uitvoer toont elk van de unieke waarden in de indexkolom.

We kunnen ook de functie len() gebruiken om het aantal unieke waarden in de indexkolom te tellen:

 #count number of unique values in index column 
len ( df.index.unique ( ))

5

We kunnen zien dat er 5 unieke waarden zijn in de indexkolom van het DataFrame.

Voorbeeld 2: Haal unieke waarden uit een specifieke kolom in MultiIndex

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd
#define index values
index_names = pd. MultiIndex . from_tuples ([(' West ',' A '),
                                         (' West ', ' A '),
                                         (' West ', ' B '),
                                         (' East ', ' C '),
                                         (' East ', ' C '),
                                         (' East ', ' D ')],
                                       names=[' Division ', ' Team '])

#define data values
data = {' Sales ': [12, 44, 29, 35, 44, 19]}

#createDataFrame
df = pd. DataFrame (data, index=index_names)

#view DataFrame
print (df)

               Sales
Division Team       
West A 12
         At 44
         B29
East C 35
         C 44
         D 19

Merk op dat dit DataFrame een multiIndex heeft.

We kunnen de volgende syntaxis gebruiken om de unieke waarden van de enkele Team- kolom van de multiIndex te verkrijgen:

 #get unique values from Team column in multiIndex
df. index . single (' Team ')

Index(['A', 'B', 'C', 'D'], dtype='object', name='Team')

De uitvoer toont de vier unieke waarden uit de kolom Team van de multiIndex: A, B, C en D.

We kunnen een vergelijkbare syntaxis gebruiken om unieke waarden uit de kolom Divisie van de multiIndex te extraheren:

 #get unique values from Division column in multiIndex
df. index . single (' Division ')

Index(['West', 'East'], dtype='object', name='Division')

De uitvoer toont de twee unieke waarden van de kolom Divisie van de multiIndex: West en Oost.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:

Hoe index naar kolom te converteren in Pandas
Hoe de index in Panda’s te hernoemen
Hoe u een kolom instelt als index in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert