Pandas: como verificar se a coluna contém uma string


Você pode usar os seguintes métodos para verificar se uma coluna de um DataFrame do pandas contém uma string:

Método 1: verifique se a string exata existe na coluna

 (df[' col ']. eq (' exact_string ')). any ()

Método 2: verifique se existe uma string parcial na coluna

 df[' col ']. str . contains (' partial_string '). any ()

Método 3: contar ocorrências parciais de string na coluna

 df[' col ']. str . contains (' partial_string '). sum ()

Este tutorial explica como usar cada método na prática com o seguinte DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Exemplo 1: Verifique se existe uma string exata na coluna

O código a seguir mostra como verificar se a string exata “Eas” existe na coluna de conferência do DataFrame:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

A saída retorna False , o que nos informa que a string exata “Eas” não existe na coluna de conferência do DataFrame.

Exemplo 2: Verifique se existe uma string parcial na coluna

O código a seguir mostra como verificar se a string parcial “Eas” existe na coluna de conferência do DataFrame:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

A saída retorna True , o que nos informa que a string parcial “Eas” existe na coluna de conferência do DataFrame.

Exemplo 3: contar ocorrências de uma string parcial em uma coluna

O código a seguir mostra como contar o número de vezes que a string parcial “Eas” aparece na coluna de conferência do DataFrame:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

A saída retorna 3 , o que nos informa que a string parcial ‘Eas’ aparece 3 vezes na coluna de conferência do DataFrame.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como excluir linhas no Pandas DataFrame com base na condição
Como filtrar um DataFrame do Pandas em múltiplas condições
Como usar o filtro “NOT IN” no Pandas DataFrame

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *