Panda: come verificare se la colonna contiene una stringa


È possibile utilizzare i seguenti metodi per verificare se una colonna di un DataFrame panda contiene una stringa:

Metodo 1: controlla se la stringa esatta esiste nella colonna

 (df[' col ']. eq (' exact_string ')). any ()

Metodo 2: controlla se esiste una stringa parziale nella colonna

 df[' col ']. str . contains (' partial_string '). any ()

Metodo 3: contare le occorrenze parziali di stringa nella colonna

 df[' col ']. str . contains (' partial_string '). sum ()

Questo tutorial spiega come utilizzare ciascun metodo nella pratica con il seguente DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Esempio 1: controlla se esiste la stringa esatta nella colonna

Il codice seguente mostra come verificare se esiste la stringa esatta “Eas” nella colonna conferenza del DataFrame:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

L’output restituisce False , che ci dice che la stringa esatta “Eas” non esiste nella colonna conference del DataFrame.

Esempio 2: controlla se esiste una stringa parziale nella colonna

Il codice seguente mostra come verificare se esiste la stringa parziale “Eas” nella colonna conferenza del DataFrame:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

L’output restituisce True , che ci dice che la stringa parziale “Eas” esiste nella colonna conference del DataFrame.

Esempio 3: contare le occorrenze di una stringa parziale in una colonna

Il codice seguente mostra come contare il numero di volte in cui la stringa parziale “Eas” appare nella colonna conferenza del DataFrame:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

L’output restituisce 3 , che ci dice che la stringa parziale ‘Eas’ appare 3 volte nella colonna conference del DataFrame.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:

Come eliminare le righe in Pandas DataFrame in base alle condizioni
Come filtrare un Pandas DataFrame su più condizioni
Come utilizzare il filtro “NOT IN” in Pandas DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *