Pandas: exclua linhas com base em múltiplas condições


Você pode usar os seguintes métodos para excluir linhas com base em múltiplas condições em um DataFrame do pandas:

Método 1: excluir linhas que atendam a uma das várias condições

 df = df. loc [ ~ ((df[' col1 '] == ' A ') | (df[' col2 '] > 6 ))]

Este exemplo específico excluirá todas as linhas onde o valor de col1 for igual a A ou o valor de col2 for maior que 6.

Método 2: remover linhas que atendem a várias condições

 df = df. loc [ ~ ((df[' col1 '] == ' A ') & (df[' col2 '] > 6 ))] 

Este exemplo específico excluirá todas as linhas onde o valor de col1 é igual a A e o valor de col2 é maior que 6.

Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' pos ': ['G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'],
                   ' assists ': [5, 7, 7, 9, 12, 9, 3, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team pos assists rebounds
0 A G 5 11
1 A G 7 8
2 A F 7 10
3 A F 9 6
4 B G 12 6
5 B G 9 5
6 B F 3 9
7 B F 4 12

Exemplo 1: Excluir linhas que atendem a uma das diversas condições

O código a seguir mostra como excluir linhas no DataFrame onde o valor na coluna Equipe é igual a A ou o valor na coluna Presenças é maior que 6:

 #drop rows where value in team column == 'A' or value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') | (df[' assists '] > 6 ))]

#view updated DataFrame
print (df)

  team pos assists rebounds
6 BF 3 9
7 BF 4 12

Observe que todas as linhas onde a coluna da equipe era igual a A ou a coluna de assistências era maior que 6 foram removidas.

Para este DataFrame específico, seis das linhas foram excluídas.

Nota : O | o símbolo representa a lógica “OR” em pandas.

Exemplo 2: Remover linhas que atendem a diversas condições

O código a seguir mostra como excluir linhas no DataFrame onde o valor na coluna Equipe é igual a A e o valor na coluna Presenças é maior que 6:

 #drop rows where value in team column == 'A' and value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') & (df[' assists '] > 6 ))]

#view updated DataFrame
print (df)

  team pos assists rebounds
0 AG 5 11
4 BG 12 6
5 BG 9 5
6 BF 3 9
7 BF 4 12

Observe que todas as linhas onde a coluna de equipes era igual a A e a coluna de assistências era maior que 6 foram removidas.

Para este DataFrame específico, três das linhas foram excluídas.

Nota : O símbolo & representa a lógica “AND” em pandas.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como deletar linhas contendo um valor específico no Pandas
Como deletar linhas contendo uma string específica no Pandas
Como deletar linhas por índice no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *