Pandas: exclua linhas com base em múltiplas condições
Você pode usar os seguintes métodos para excluir linhas com base em múltiplas condições em um DataFrame do pandas:
Método 1: excluir linhas que atendam a uma das várias condições
df = df. loc [ ~ ((df[' col1 '] == ' A ') | (df[' col2 '] > 6 ))]
Este exemplo específico excluirá todas as linhas onde o valor de col1 for igual a A ou o valor de col2 for maior que 6.
Método 2: remover linhas que atendem a várias condições
df = df. loc [ ~ ((df[' col1 '] == ' A ') & (df[' col2 '] > 6 ))]
Este exemplo específico excluirá todas as linhas onde o valor de col1 é igual a A e o valor de col2 é maior que 6.
Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' pos ': ['G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'], ' assists ': [5, 7, 7, 9, 12, 9, 3, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team pos assists rebounds 0 A G 5 11 1 A G 7 8 2 A F 7 10 3 A F 9 6 4 B G 12 6 5 B G 9 5 6 B F 3 9 7 B F 4 12
Exemplo 1: Excluir linhas que atendem a uma das diversas condições
O código a seguir mostra como excluir linhas no DataFrame onde o valor na coluna Equipe é igual a A ou o valor na coluna Presenças é maior que 6:
#drop rows where value in team column == 'A' or value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') | (df[' assists '] > 6 ))]
#view updated DataFrame
print (df)
team pos assists rebounds
6 BF 3 9
7 BF 4 12
Observe que todas as linhas onde a coluna da equipe era igual a A ou a coluna de assistências era maior que 6 foram removidas.
Para este DataFrame específico, seis das linhas foram excluídas.
Nota : O | o símbolo representa a lógica “OR” em pandas.
Exemplo 2: Remover linhas que atendem a diversas condições
O código a seguir mostra como excluir linhas no DataFrame onde o valor na coluna Equipe é igual a A e o valor na coluna Presenças é maior que 6:
#drop rows where value in team column == 'A' and value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') & (df[' assists '] > 6 ))]
#view updated DataFrame
print (df)
team pos assists rebounds
0 AG 5 11
4 BG 12 6
5 BG 9 5
6 BF 3 9
7 BF 4 12
Observe que todas as linhas onde a coluna de equipes era igual a A e a coluna de assistências era maior que 6 foram removidas.
Para este DataFrame específico, três das linhas foram excluídas.
Nota : O símbolo & representa a lógica “AND” em pandas.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como deletar linhas contendo um valor específico no Pandas
Como deletar linhas contendo uma string específica no Pandas
Como deletar linhas por índice no Pandas