Panda's: rijen filteren die een specifieke string bevatten


U kunt de volgende syntaxis gebruiken om rijen te filteren die een bepaalde tekenreeks bevatten in een Panda DataFrame:

 df[df[" col "]. str . contains (“ this string ”)]

In deze zelfstudie worden verschillende voorbeelden uitgelegd van praktisch gebruik van deze syntaxis met het volgende DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6
5 C East 5

Voorbeeld 1: Filter rijen die een specifieke tekenreeks bevatten

De volgende code laat zien hoe u rijen in het DataFrame filtert die ‚A‘ in de teamkolom bevatten:

 df[df[" team "]. str . contains (“ A ”)]

	team conference points
0 A East 11
1 A East 8
2 A East 10

Alleen regels waarvan de teamkolom ‚A‘ bevat, worden bewaard.

Voorbeeld 2: Filter rijen die een tekenreeks bevatten in een lijst

De volgende code laat zien hoe u rijen in het DataFrame filtert die ‚A‘ of ‚B‘ bevatten in de teamkolom:

 df[df[" team "]. str . contains (“ A|B ”)]

	team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6

Alleen regels waarvan de teamkolom ‚A‘ of ‚B‘ bevat, worden bewaard.

Voorbeeld 3: Filter rijen die een gedeeltelijke tekenreeks bevatten

In de voorgaande voorbeelden hebben we gefilterd op basis van rijen die exact overeenkomen met een of meer tekenreeksen.

Als we echter rijen willen filteren die een gedeeltelijke tekenreeks bevatten, kunnen we de volgende syntaxis gebruiken:

 #identify partial string to look for
keep=[" Wes "]

#filter for rows that contain the partial string "Wes" in the conference column
df[df. conference . str . contains (' | ' .join (keep))]

	team conference points
3 B West 6
4 B West 6

Alleen regels waarin de conferentiekolom “Wes” bevat, worden behouden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe rijen in Pandas DataFrame te verwijderen op basis van de voorwaarde
Hoe u een Pandas DataFrame op meerdere voorwaarden kunt filteren
Hoe u het “NIET IN”-filter in Pandas DataFrame gebruikt

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert