Pandas: so filtern sie zeilen, die eine bestimmte zeichenfolge enthalten
Mit der folgenden Syntax können Sie Zeilen filtern, die eine bestimmte Zeichenfolge in einem Pandas-DataFrame enthalten:
df[df[" col "]. str . contains (“ this string ”)]
In diesem Tutorial werden mehrere Beispiele für die praktische Verwendung dieser Syntax mit dem folgenden DataFrame erläutert:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Beispiel 1: Zeilen filtern, die eine bestimmte Zeichenfolge enthalten
Der folgende Code zeigt, wie Zeilen im DataFrame gefiltert werden, die „A“ in der Teamspalte enthalten:
df[df[" team "]. str . contains (“ A ”)] team conference points 0 A East 11 1 A East 8 2 A East 10
Es werden nur Zeilen beibehalten, deren Teamspalte „A“ enthält.
Beispiel 2: Zeilen filtern, die eine Zeichenfolge in einer Liste enthalten
Der folgende Code zeigt, wie Zeilen im DataFrame gefiltert werden, die „A“ oder „B“ in der Teamspalte enthalten:
df[df[" team "]. str . contains (“ A|B ”)] team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6
Es werden nur Zeilen beibehalten, deren Teamspalte „A“ oder „B“ enthält.
Beispiel 3: Zeilen filtern, die eine Teilzeichenfolge enthalten
In den vorherigen Beispielen haben wir nach Zeilen gefiltert, die genau mit einer oder mehreren Zeichenfolgen übereinstimmen.
Wenn wir jedoch Zeilen filtern möchten, die eine Teilzeichenfolge enthalten, können wir die folgende Syntax verwenden:
#identify partial string to look for keep=[" Wes "] #filter for rows that contain the partial string "Wes" in the conference column df[df. conference . str . contains (' | ' .join (keep))] team conference points 3 B West 6 4 B West 6
Es werden nur Zeilen beibehalten, in denen die Konferenzspalte „Wes“ enthält.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So löschen Sie Zeilen in Pandas DataFrame basierend auf der Bedingung
So filtern Sie einen Pandas DataFrame nach mehreren Bedingungen
So verwenden Sie den „NOT IN“-Filter in Pandas DataFrame