Panda's: hoe u kunt controleren of een kolom een string bevat


U kunt de volgende methoden gebruiken om te controleren of een kolom van een Panda DataFrame een tekenreeks bevat:

Methode 1: Controleer of de exacte tekenreeks in de kolom voorkomt

 (df[' col ']. eq (' exact_string ')). any ()

Methode 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat

 df[' col ']. str . contains (' partial_string '). any ()

Methode 3: Tel gedeeltelijke tekenreeksexemplaren in de kolom

 df[' col ']. str . contains (' partial_string '). sum ()

In deze tutorial wordt uitgelegd hoe u elke methode in de praktijk kunt gebruiken met het volgende DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Voorbeeld 1: Controleer of er een exacte tekenreeks in de kolom bestaat

De volgende code laat zien hoe u kunt controleren of de exacte tekenreeks ‚Eas‘ bestaat in de conferentiekolom van het DataFrame:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

De uitvoer retourneert False , wat ons vertelt dat de exacte tekenreeks „Eas“ niet bestaat in de conferentiekolom van het DataFrame.

Voorbeeld 2: Controleer of er een gedeeltelijke tekenreeks in de kolom bestaat

De volgende code laat zien hoe u kunt controleren of de gedeeltelijke tekenreeks ‚Eas‘ bestaat in de conferentiekolom van het DataFrame:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

De uitvoer retourneert True , wat ons vertelt dat de gedeeltelijke tekenreeks „Eas“ bestaat in de conferentiekolom van het DataFrame.

Voorbeeld 3: Tel het aantal keren dat een gedeeltelijke tekenreeks in een kolom voorkomt

De volgende code laat zien hoe u het aantal keren kunt tellen dat de gedeeltelijke tekenreeks ‚Eas‘ in de conferentiekolom van het DataFrame verschijnt:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

De uitvoer retourneert 3 , wat ons vertelt dat de gedeeltelijke tekenreeks ‚Eas‘ 3 keer voorkomt in de conferentiekolom van het DataFrame.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe rijen in Pandas DataFrame te verwijderen op basis van de voorwaarde
Hoe u een Pandas DataFrame op meerdere voorwaarden kunt filteren
Hoe u het “NIET IN”-filter in Pandas DataFrame gebruikt

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert