Panda's: hoe u kunt controleren of een kolom een string bevat
U kunt de volgende methoden gebruiken om te controleren of een kolom van een Panda DataFrame een tekenreeks bevat:
Methode 1: Controleer of de exacte tekenreeks in de kolom voorkomt
(df[' col ']. eq (' exact_string ')). any ()
Methode 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat
df[' col ']. str . contains (' partial_string '). any ()
Methode 3: Tel gedeeltelijke tekenreeksexemplaren in de kolom
df[' col ']. str . contains (' partial_string '). sum ()
In deze tutorial wordt uitgelegd hoe u elke methode in de praktijk kunt gebruiken met het volgende DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
Voorbeeld 1: Controleer of er een exacte tekenreeks in de kolom bestaat
De volgende code laat zien hoe u kunt controleren of de exacte tekenreeks ‚Eas‘ bestaat in de conferentiekolom van het DataFrame:
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
De uitvoer retourneert False , wat ons vertelt dat de exacte tekenreeks „Eas“ niet bestaat in de conferentiekolom van het DataFrame.
Voorbeeld 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat
De volgende code laat zien hoe u kunt controleren of de gedeeltelijke tekenreeks ‚Eas‘ bestaat in de conferentiekolom van het DataFrame:
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
De uitvoer retourneert True , wat ons vertelt dat de gedeeltelijke tekenreeks „Eas“ bestaat in de conferentiekolom van het DataFrame.
Voorbeeld 3: Tel het aantal keren dat een gedeeltelijke tekenreeks in een kolom voorkomt
De volgende code laat zien hoe u het aantal keren kunt tellen dat de gedeeltelijke tekenreeks ‚Eas‘ in de conferentiekolom van het DataFrame verschijnt:
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
De uitvoer retourneert 3 , wat ons vertelt dat de gedeeltelijke tekenreeks ‚Eas‘ 3 keer voorkomt in de conferentiekolom van het DataFrame.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe rijen in Pandas DataFrame te verwijderen op basis van de voorwaarde
Hoe u een Pandas DataFrame op meerdere voorwaarden kunt filteren
Hoe u het “NIET IN”-filter in Pandas DataFrame gebruikt