Pandas: so überprüfen sie, ob die spalte eine zeichenfolge enthält
Mit den folgenden Methoden können Sie überprüfen, ob eine Spalte eines Pandas-DataFrames eine Zeichenfolge enthält:
Methode 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist
(df[' col ']. eq (' exact_string ')). any ()
Methode 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist
df[' col ']. str . contains (' partial_string '). any ()
Methode 3: Teilweise vorkommende Zeichenfolgen in der Spalte zählen
df[' col ']. str . contains (' partial_string '). sum ()
In diesem Tutorial wird erklärt, wie Sie jede Methode in der Praxis mit dem folgenden DataFrame verwenden:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
Beispiel 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist
Der folgende Code zeigt, wie überprüft wird, ob die genaue Zeichenfolge „Eas“ in der Konferenzspalte des DataFrame vorhanden ist:
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
Die Ausgabe gibt False zurück, was uns mitteilt, dass die genaue Zeichenfolge „Eas“ in der Konferenzspalte des DataFrame nicht vorhanden ist.
Beispiel 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist
Der folgende Code zeigt, wie überprüft wird, ob die Teilzeichenfolge „Eas“ in der Konferenzspalte des DataFrame vorhanden ist:
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
Die Ausgabe gibt True zurück, was uns mitteilt, dass die Teilzeichenfolge „Eas“ in der Konferenzspalte des DataFrame vorhanden ist.
Beispiel 3: Zählen Sie das Vorkommen einer Teilzeichenfolge in einer Spalte
Der folgende Code zeigt, wie man zählt, wie oft die Teilzeichenfolge „Eas“ in der Konferenzspalte des DataFrame erscheint:
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
Die Ausgabe gibt 3 zurück, was uns sagt, dass die Teilzeichenfolge „Eas“ dreimal in der Konferenzspalte des DataFrame vorkommt.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:
So löschen Sie Zeilen in Pandas DataFrame basierend auf der Bedingung
So filtern Sie einen Pandas DataFrame nach mehreren Bedingungen
So verwenden Sie den „NOT IN“-Filter in Pandas DataFrame