Como excluir várias colunas no pandas (4 métodos)


Você pode usar os seguintes métodos para remover várias colunas de um DataFrame do pandas:

Método 1: remover várias colunas por nome

 df. drop (columns=[' col1 ', ' col2 ', ' col4 '], inplace= True )

Método 2: remover colunas no intervalo por nome

 df. drop (columns= df.loc [:, ' col1 ':' col4 '], inplace= True )

Método 3: eliminar várias colunas por índice

 df. drop (columns=df. columns [[0, 3, 4]], inplace= True )

Método 4: remover colunas no intervalo por índice

 df. drop (columns= df.columns [1:4], inplace= True )

Nota : O argumento inplace=True diz ao pandas para remover colunas inplace sem reatribuir o DataFrame.

Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' steals ': [4, 5, 10, 12, 4, 8, 7, 2]})

#view DataFrame
print (df)

  team points assists rebounds steals
0 A 18 5 11 4
1 B 22 7 8 5
2 C 19 7 10 10
3 D 14 9 6 12
4 E 14 12 6 4
5 F 11 9 5 8
6 G 20 9 9 7
7:28 4 12 2

Exemplo 1: Remover múltiplas colunas por nome

O código a seguir mostra como remover as colunas points , rebotes e steals por nome:

 #drop multiple columns by name
df. drop (columns=[' points ', ' rebounds ', ' steals '], inplace= True )

#view updated Dataframe
print (df)

  team assists
0 to 5
1 B 7
2 C 7
3 D 9
4 E 12
5 F 9
6 G 9
7:04 a.m.

Exemplo 2: Remover colunas no intervalo por nome

O código a seguir mostra como eliminar cada coluna entre as colunas de pontos e rejeições por nome:

 #drop columns in range by name
df. drop (columns= df.loc [:, ' points ':' rebounds '], inplace= True )

#view updated Dataframe
print (df)

  team steals
0 to 4
1 B 5
2 C 10
3 D 12
4 E 4
5 F 8
6 G 7
7 A.M. 2

Exemplo 3: Eliminar múltiplas colunas por índice

O código a seguir mostra como remover colunas nas posições de índice 0, 3 e 4 do DataFrame:

 #drop multiple columns by index
df. drop (columns=df. columns [[0, 3, 4]], inplace= True )

#view updated Dataframe
print (df)

   assist points
0 18 5
1 22 7
2 19 7
3 14 9
4 14 12
5 11 9
6 20 9
7 28 4

Exemplo 4: Remover colunas no intervalo por índice

O código a seguir mostra como remover colunas nas posições de índice 0, 3 e 4 do DataFrame:

 #drop columns by index range
df. drop (columns= df.columns [1:4], inplace= True )

#view updated Dataframe
print (df)

  team steals
0 to 4
1 B 5
2 C 10
3 D 12
4 E 4
5 F 8
6 G 7
7 A.M. 2

Observe que a sintaxe df.columns[1:4] especifica colunas nas posições de índice 1 a 4.

Portanto, esta sintaxe remove colunas nas posições de índice 1, 2 e 3.

Nota : Você pode encontrar a documentação completa para a função drop() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Pandas: Como remover colunas com valores NaN
Pandas: Como remover colunas que não estão na lista
Pandas: como remover todas as colunas, exceto as específicas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *