Como obter nomes de colunas no pandas (3 métodos)
Você pode usar os seguintes métodos para obter nomes de colunas em um DataFrame do pandas:
Método 1: obtenha todos os nomes de colunas
list (df)
Método 2: obtenha os nomes das colunas em ordem alfabética
sorted (df)
Método 3: obter nomes de colunas com um tipo de dados específico
list ( df.select_dtypes (include=[' int64 ', ' bool ']))
Os exemplos a seguir mostram como usar cada método com o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [18, 22, 19, 14, 14, 11], ' assists ': [5, 7, 7, 9, 12, 9], ' playoffs ': [True, False, False, True, True, True]}) #view DataFrame print (df) team points assists playoffs 0 A 18 5 True 1 B 22 7 False 2 C 19 7 False 3 D 14 9 True 4 E 14 12 True 5 F 11 9 True
Exemplo 1: Obtenha todos os nomes de colunas
A maneira mais fácil de obter todos os nomes de colunas em um DataFrame do pandas é usar list() da seguinte forma:
#get all column names
list (df)
['team', 'points', 'assists', 'playoffs']
O resultado é uma lista contendo os quatro nomes de colunas do DataFrame do pandas.
Exemplo 2: Obtenha os nomes das colunas em ordem alfabética
Para obter os nomes das colunas em um DataFrame do pandas em ordem alfabética, você pode usar a função sorted() da seguinte forma:
#get column names in alphabetical order
sorted (df)
['assists', 'playoffs', 'points', 'team']
O resultado é uma lista contendo os quatro nomes de colunas do DataFrame do pandas listados em ordem alfabética.
Você também pode usar o argumento reverse=True para obter os nomes das colunas em ordem alfabética reversa:
#get column names in reverse alphabetical order
sorted (df, reverse= True )
['team', 'points', 'playoffs', 'assists']
Exemplo 3: Obtenha nomes de colunas com um tipo de dados específico
Você pode usar a seguinte sintaxe para exibir o tipo de dados de cada coluna no DataFrame:
#view data type of each column
df. dtypes
team object
int64 dots
assists int64
playoffs bool
dtype:object
Você pode então usar a função select_dtypes() para obter apenas os nomes das colunas com um tipo de dados específico.
Por exemplo, podemos usar a seguinte sintaxe para obter apenas nomes de colunas que possuem um tipo de dados int64 ou bool :
#get all columns that have data type of int64 or bool
list ( df.select_dtypes (include=[' int64 ', ' bool ']))
['points', 'assists', 'playoffs']
O resultado é uma lista de nomes de colunas com tipo de dados int64 ou bool .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Pandas: como renomear colunas
Pandas: Como definir uma coluna como índice
Pandas: obtém o índice de linhas cuja coluna corresponde ao valor