Panda: come verificare se la colonna contiene una stringa
È possibile utilizzare i seguenti metodi per verificare se una colonna di un DataFrame panda contiene una stringa:
Metodo 1: controlla se la stringa esatta esiste nella colonna
(df[' col ']. eq (' exact_string ')). any ()
Metodo 2: controlla se esiste una stringa parziale nella colonna
df[' col ']. str . contains (' partial_string '). any ()
Metodo 3: contare le occorrenze parziali di stringa nella colonna
df[' col ']. str . contains (' partial_string '). sum ()
Questo tutorial spiega come utilizzare ciascun metodo nella pratica con il seguente DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
Esempio 1: controlla se esiste la stringa esatta nella colonna
Il codice seguente mostra come verificare se esiste la stringa esatta “Eas” nella colonna conferenza del DataFrame:
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
L’output restituisce False , che ci dice che la stringa esatta “Eas” non esiste nella colonna conference del DataFrame.
Esempio 2: controlla se esiste una stringa parziale nella colonna
Il codice seguente mostra come verificare se esiste la stringa parziale “Eas” nella colonna conferenza del DataFrame:
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
L’output restituisce True , che ci dice che la stringa parziale “Eas” esiste nella colonna conference del DataFrame.
Esempio 3: contare le occorrenze di una stringa parziale in una colonna
Il codice seguente mostra come contare il numero di volte in cui la stringa parziale “Eas” appare nella colonna conferenza del DataFrame:
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
L’output restituisce 3 , che ci dice che la stringa parziale ‘Eas’ appare 3 volte nella colonna conference del DataFrame.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Come eliminare le righe in Pandas DataFrame in base alle condizioni
Come filtrare un Pandas DataFrame su più condizioni
Come utilizzare il filtro “NOT IN” in Pandas DataFrame