Pandas: como renomear colunas com um dicionário


Você pode usar a seguinte sintaxe básica para renomear colunas com um dicionário no pandas:

 #define dictionary
some_dict = {' old_col1 ': ' new_col1 ',
             ' old_col2 ': ' new_col2 ',
             ' old_col3 ': ' new_col3 '}
 
#rename columns in DataFrame using dictionary
df. rename (columns=some_dict, inplace= True )

Nota : Você deve especificar inplace=True para modificar os nomes das colunas do DataFrame original.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: renomear colunas no Pandas com o dicionário

Suponha que temos o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' rebounds ': [10, 14, 14, 13, 13, 12, 10, 7],
                    ' points ': [30, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [5, 6, 6, 5, 8, 7, 7, 9]})

#view DataFrame
print (df)

   rebound points assists
0 10 30 5
1 14 22 6
2 14 19 6
3 13 14 5
4 13 14 8
5 12 11 7
6 10 20 7
7 7 28 9

Podemos usar a seguinte sintaxe para renomear cada uma das colunas do DataFrame usando um dicionário:

 #define dictionary with new column names
some_dict = {' rebounds ': ' rebs ',
             ' points ': ' pts ',
             ' assists ': ' ast '}
 
#rename columns in DataFrame using dictionary
df. rename (columns=some_dict, inplace= True )

#view updated DataFrame
print (df)

   rebs pts ast
0 10 30 5
1 14 22 6
2 14 19 6
3 13 14 5
4 13 14 8
5 12 11 7
6 10 20 7
7 7 28 9

Observe que cada uma das colunas foi renomeada com base nos valores que especificamos no dicionário.

É importante notar que você não precisa renomear todas as colunas usando um dicionário.

Por exemplo, poderíamos criar um dicionário para renomear apenas as colunas de pontos e assistências do DataFrame:

 #define dictionary with new column names for points and assists only
some_dict = {' points ':' pts ',
             ' assists ': ' ast '}
 
#rename columns in DataFrame using dictionary
df. rename (columns=some_dict, inplace= True )

#view updated DataFrame
print (df)

   rebounds pts ast
0 10 30 5
1 14 22 6
2 14 19 6
3 13 14 5
4 13 14 8
5 12 11 7
6 10 20 7
7 7 28 9

Apenas as colunas de pontos e assistências foram renomeadas.

Como a coluna bounces não foi incluída no dicionário, ela não foi renomeada no DataFrame.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como listar todos os nomes de colunas no Pandas
Como classificar colunas por nome no Pandas
Como remover colunas duplicadas no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *