Como obter nomes de colunas no pandas (3 métodos)


Você pode usar os seguintes métodos para obter nomes de colunas em um DataFrame do pandas:

Método 1: obtenha todos os nomes de colunas

 list (df)

Método 2: obtenha os nomes das colunas em ordem alfabética

 sorted (df)

Método 3: obter nomes de colunas com um tipo de dados específico

 list ( df.select_dtypes (include=[' int64 ', ' bool ']))

Os exemplos a seguir mostram como usar cada método com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' playoffs ': [True, False, False, True, True, True]})

#view DataFrame
print (df)

  team points assists playoffs
0 A 18 5 True
1 B 22 7 False
2 C 19 7 False
3 D 14 9 True
4 E 14 12 True
5 F 11 9 True

Exemplo 1: Obtenha todos os nomes de colunas

A maneira mais fácil de obter todos os nomes de colunas em um DataFrame do pandas é usar list() da seguinte forma:

 #get all column names
list (df)

['team', 'points', 'assists', 'playoffs']

O resultado é uma lista contendo os quatro nomes de colunas do DataFrame do pandas.

Exemplo 2: Obtenha os nomes das colunas em ordem alfabética

Para obter os nomes das colunas em um DataFrame do pandas em ordem alfabética, você pode usar a função sorted() da seguinte forma:

 #get column names in alphabetical order
sorted (df)

['assists', 'playoffs', 'points', 'team']

O resultado é uma lista contendo os quatro nomes de colunas do DataFrame do pandas listados em ordem alfabética.

Você também pode usar o argumento reverse=True para obter os nomes das colunas em ordem alfabética reversa:

 #get column names in reverse alphabetical order
sorted (df, reverse= True )

['team', 'points', 'playoffs', 'assists']

Exemplo 3: Obtenha nomes de colunas com um tipo de dados específico

Você pode usar a seguinte sintaxe para exibir o tipo de dados de cada coluna no DataFrame:

 #view data type of each column
df. dtypes

team object
int64 dots
assists int64
playoffs bool
dtype:object

Você pode então usar a função select_dtypes() para obter apenas os nomes das colunas com um tipo de dados específico.

Por exemplo, podemos usar a seguinte sintaxe para obter apenas nomes de colunas que possuem um tipo de dados int64 ou bool :

 #get all columns that have data type of int64 or bool
list ( df.select_dtypes (include=[' int64 ', ' bool ']))

['points', 'assists', 'playoffs']

O resultado é uma lista de nomes de colunas com tipo de dados int64 ou bool .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Pandas: como renomear colunas
Pandas: Como definir uma coluna como índice
Pandas: obtém o índice de linhas cuja coluna corresponde ao valor

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *