Pandas: como verificar se existe valor na coluna
Você pode usar os seguintes métodos para verificar se um valor específico existe em uma coluna de um DataFrame do pandas:
Método 1: verifique se há um valor na coluna
22 in df[' my_column ']. values
Método 2: verifique se existe algum dos vários valores na coluna
df[' my_column ']. isin ([44, 45, 22]). any ()
Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Exemplo 1: Verifique se existe um valor na coluna
O código a seguir mostra como verificar se o valor 22 existe na coluna de pontos :
#check if 22 exists in the 'points' column 22 in df[' points ']. values True
A saída retorna True , o que nos informa que o valor 22 existe na coluna de pontos .
Também podemos usar a mesma sintaxe com colunas de string.
Por exemplo, o código a seguir mostra como verificar se a string “J” existe na coluna da equipe :
#check if 'J' exists in the 'team' column 'J' in df[' team ']. values False
A saída retorna False , o que nos informa que a string “J” não existe na coluna Equipe .
Exemplo 2: Verifique se existe um dos vários valores na coluna
O código a seguir mostra como verificar se algum dos valores da lista [44, 45, 22] existe na coluna de pontos :
#check if 44, 45 or 22 exist in the 'points' column df[' points ']. isin ([44, 45, 22]). any () True
A saída retorna True , o que nos informa que pelo menos um dos valores da lista [44, 45, 22] existe na coluna de pontos do DataFrame.
Também podemos usar a mesma sintaxe com colunas de string.
Por exemplo, o código a seguir mostra como verificar se uma string da lista [‘J’, ‘K’, ‘L’] existe na coluna da equipe :
#check if J, K, or L exists in the 'team' column df[' team ']. isin ([' J ',' K ',' L ']). any () False
A saída retorna False , o que nos informa que nenhuma das strings da lista existe na coluna team .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como excluir linhas no Pandas DataFrame com base na condição
Como filtrar um DataFrame do Pandas em múltiplas condições
Como usar o filtro “NOT IN” no Pandas DataFrame