Pandas: como excluir linhas contendo um valor específico
Você pode usar a seguinte sintaxe para excluir linhas em um DataFrame do pandas que contém um valor específico em uma determinada coluna:
#drop rows that contain specific 'value' in 'column_name' df = df[df. column_name != value ]
Você pode usar a seguinte sintaxe para excluir linhas em um DataFrame do pandas que contém qualquer valor em uma determinada lista:
#define values values = [value1, value2, value3, ...] #drop rows that contain any value in the list df = df[df. column_name . isin (values) == False ]
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Excluir linhas contendo um valor específico
O código a seguir mostra como excluir todas as linhas que contêm um valor específico em uma coluna:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'],
' name ': ['Dirk', 'Kobe', 'Tim', 'Lebron'],
' rebounds ': [11, 7, 14, 7],
' points ': [26, 31, 22, 29]})
#view DataFrame
df
team name rebound points
0 Mavs Dirk 11 26
1 Lakers Kobe 7 31
2 Spurs Tim 14 22
3 Cavs LeBron 7 29
#drop any rows that have 7 in the rebounds column
df = df[df. rebounds != 7 ]
#view resulting DataFrame
df
team name rebound points
0 Mavs Dirk 11 26
2 Spurs Tim 14 22
Exemplo 2: Remover linhas contendo valores em uma lista
O código a seguir mostra como remover todas as linhas do DataFrame que contêm um valor em uma lista:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'],
' name ': ['Dirk', 'Kobe', 'Tim', 'Lebron'],
' rebounds ': [11, 7, 14, 7],
' points ': [26, 31, 22, 29]})
#view DataFrame
df
team name rebound points
0 Mavs Dirk 11 26
1 Lakers Kobe 7 31
2 Spurs Tim 14 22
3 Cavs LeBron 7 29
#define list of values
values = [7, 11]
#drop any rows that have 7 or 11 in the rebounds column
df = df[df. rebounds . isin (values) == False ]
#view resulting DataFrame
df
team name rebound points
2 Spurs Tim 14 22
Exemplo 3: Remover linhas contendo valores específicos em múltiplas colunas
O código a seguir mostra como remover linhas do DataFrame que contêm um valor específico em uma das várias colunas:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'],
' name ': ['Dirk', 'Kobe', 'Tim', 'Lebron'],
' rebounds ': [11, 7, 14, 7],
' points ': [26, 31, 22, 29]})
#view DataFrame
df
team name rebound points
0 Mavs Dirk 11 26
1 Lakers Kobe 7 31
2 Spurs Tim 14 22
3 Cavs LeBron 7 29
#drop any rows that have 11 in the rebounds column or 31 in the points column
df = df[(df. rebounds != 11 ) & (df. points != 31 )]
#view resulting DataFrame
df
team name rebound points
2 Spurs Tim 14 22
3 Cavs LeBron 7 29
Recursos adicionais
Como deletar linhas por índice no Pandas
Como deletar colunas por índice no Pandas
Como deletar linhas contendo uma string específica no Pandas