Como preservar certas colunas em pandas (com exemplos)


Você pode usar os seguintes métodos para persistir apenas determinadas colunas em um DataFrame do pandas:

Método 1: especifique quais colunas manter

 #only keep columns 'col1' and 'col2'
df[[' col1 ', ' col2 ']]

Método 2: especifique colunas a serem excluídas

 #drop columns 'col3' and 'col4'
df[df. columns [~df. columns . isin ([' col3 ',' col4 '])]]

Os exemplos a seguir mostram como usar cada método com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

Método 1: especifique quais colunas manter

O código a seguir mostra como definir um novo DataFrame que retém apenas as colunas “equipe” e “pontos”:

 #create new DataFrame and only keep 'team' and 'points' columns
df2 = df[[' team ', ' points ']]

#view new DataFrame
df2

        team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13

Observe que o DataFrame resultante retém apenas as duas colunas que especificamos.

Método 2: especifique colunas a serem excluídas

O código a seguir mostra como definir um novo DataFrame que remove as colunas “attends” e “bounces” do DataFrame original:

 #create new DataFrame and that drops 'assists' and 'rebounds'
df2 = df[df. columns [~df. columns . isin ([' assists ', ' rebounds '])]]

#view new DataFrame
df2

        team points
0 to 11
1 to 7
2 to 8
3 B 10
4 B 13
5 B 13

Observe que o DataFrame resultante remove as colunas “assistências” e “rejeições” do DataFrame original e mantém as colunas restantes.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como remover a primeira coluna no Pandas DataFrame
Como remover colunas duplicadas no Pandas
Como deletar colunas por índice no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *