Kolomnamen verkrijgen in pandas (3 methoden)


U kunt de volgende methoden gebruiken om kolomnamen op te halen in een Panda DataFrame:

Methode 1: Haal alle kolomnamen op

 list (df)

Methode 2: Kolomnamen alfabetisch ophalen

 sorted (df)

Methode 3: Kolomnamen ophalen met een specifiek gegevenstype

 list ( df.select_dtypes (include=[' int64 ', ' bool ']))

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' playoffs ': [True, False, False, True, True, True]})

#view DataFrame
print (df)

  team points assists playoffs
0 A 18 5 True
1 B 22 7 False
2 C 19 7 False
3 D 14 9 True
4 E 14 12 True
5 F 11 9 True

Voorbeeld 1: Haal alle kolomnamen op

De eenvoudigste manier om alle kolomnamen in een panda’s DataFrame te krijgen, is door list() als volgt te gebruiken:

 #get all column names
list (df)

['team', 'points', 'assists', 'playoffs']

Het resultaat is een lijst met de vier kolomnamen van het panda’s DataFrame.

Voorbeeld 2: Kolomnamen alfabetisch ophalen

Om de kolomnamen in een Panda DataFrame in alfabetische volgorde te krijgen, kunt u de functie sort() als volgt gebruiken:

 #get column names in alphabetical order
sorted (df)

['assists', 'playoffs', 'points', 'team']

Het resultaat is een lijst met de vier kolomnamen van de panda’s DataFrame, in alfabetische volgorde.

U kunt ook het argument reverse=True gebruiken om de kolomnamen in omgekeerde alfabetische volgorde te krijgen:

 #get column names in reverse alphabetical order
sorted (df, reverse= True )

['team', 'points', 'playoffs', 'assists']

Voorbeeld 3: Kolomnamen ophalen met een specifiek gegevenstype

U kunt de volgende syntaxis gebruiken om het gegevenstype van elke kolom in het DataFrame weer te geven:

 #view data type of each column
df. dtypes

team object
int64 dots
assists int64
playoffs bool
dtype:object

U kunt vervolgens de functie select_dtypes() gebruiken om alleen de kolomnamen met een specifiek gegevenstype op te halen.

We kunnen bijvoorbeeld de volgende syntaxis gebruiken om alleen kolomnamen op te halen die het gegevenstype int64 of bool hebben:

 #get all columns that have data type of int64 or bool
list ( df.select_dtypes (include=[' int64 ', ' bool ']))

['points', 'assists', 'playoffs']

Het resultaat is een lijst met kolomnamen met het gegevenstype int64 of bool .

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Panda’s: kolommen hernoemen
Panda’s: een kolom instellen als index
Panda’s: haal de index op van rijen waarvan de kolom overeenkomt met de waarde

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert