Panda's: rijen filteren die een specifieke string bevatten
U kunt de volgende syntaxis gebruiken om rijen te filteren die een bepaalde tekenreeks bevatten in een Panda DataFrame:
df[df[" col "]. str . contains (“ this string ”)]
In deze zelfstudie worden verschillende voorbeelden uitgelegd van praktisch gebruik van deze syntaxis met het volgende DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Voorbeeld 1: Filter rijen die een specifieke tekenreeks bevatten
De volgende code laat zien hoe u rijen in het DataFrame filtert die ‚A‘ in de teamkolom bevatten:
df[df[" team "]. str . contains (“ A ”)] team conference points 0 A East 11 1 A East 8 2 A East 10
Alleen regels waarvan de teamkolom ‚A‘ bevat, worden bewaard.
Voorbeeld 2: Filter rijen die een tekenreeks bevatten in een lijst
De volgende code laat zien hoe u rijen in het DataFrame filtert die ‚A‘ of ‚B‘ bevatten in de teamkolom:
df[df[" team "]. str . contains (“ A|B ”)] team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6
Alleen regels waarvan de teamkolom ‚A‘ of ‚B‘ bevat, worden bewaard.
Voorbeeld 3: Filter rijen die een gedeeltelijke tekenreeks bevatten
In de voorgaande voorbeelden hebben we gefilterd op basis van rijen die exact overeenkomen met een of meer tekenreeksen.
Als we echter rijen willen filteren die een gedeeltelijke tekenreeks bevatten, kunnen we de volgende syntaxis gebruiken:
#identify partial string to look for keep=[" Wes "] #filter for rows that contain the partial string "Wes" in the conference column df[df. conference . str . contains (' | ' .join (keep))] team conference points 3 B West 6 4 B West 6
Alleen regels waarin de conferentiekolom “Wes” bevat, worden behouden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe rijen in Pandas DataFrame te verwijderen op basis van de voorwaarde
Hoe u een Pandas DataFrame op meerdere voorwaarden kunt filteren
Hoe u het “NIET IN”-filter in Pandas DataFrame gebruikt