Pandas: so überprüfen sie, ob die spalte eine zeichenfolge enthält


Mit den folgenden Methoden können Sie überprüfen, ob eine Spalte eines Pandas-DataFrames eine Zeichenfolge enthält:

Methode 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist

 (df[' col ']. eq (' exact_string ')). any ()

Methode 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist

 df[' col ']. str . contains (' partial_string '). any ()

Methode 3: Teilweise vorkommende Zeichenfolgen in der Spalte zählen

 df[' col ']. str . contains (' partial_string '). sum ()

In diesem Tutorial wird erklärt, wie Sie jede Methode in der Praxis mit dem folgenden DataFrame verwenden:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Beispiel 1: Überprüfen Sie, ob die genaue Zeichenfolge in der Spalte vorhanden ist

Der folgende Code zeigt, wie überprüft wird, ob die genaue Zeichenfolge „Eas“ in der Konferenzspalte des DataFrame vorhanden ist:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

Die Ausgabe gibt False zurück, was uns mitteilt, dass die genaue Zeichenfolge „Eas“ in der Konferenzspalte des DataFrame nicht vorhanden ist.

Beispiel 2: Überprüfen Sie, ob in der Spalte eine Teilzeichenfolge vorhanden ist

Der folgende Code zeigt, wie überprüft wird, ob die Teilzeichenfolge „Eas“ in der Konferenzspalte des DataFrame vorhanden ist:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

Die Ausgabe gibt True zurück, was uns mitteilt, dass die Teilzeichenfolge „Eas“ in der Konferenzspalte des DataFrame vorhanden ist.

Beispiel 3: Zählen Sie das Vorkommen einer Teilzeichenfolge in einer Spalte

Der folgende Code zeigt, wie man zählt, wie oft die Teilzeichenfolge „Eas“ in der Konferenzspalte des DataFrame erscheint:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

Die Ausgabe gibt 3 zurück, was uns sagt, dass die Teilzeichenfolge „Eas“ dreimal in der Konferenzspalte des DataFrame vorkommt.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

So löschen Sie Zeilen in Pandas DataFrame basierend auf der Bedingung
So filtern Sie einen Pandas DataFrame nach mehreren Bedingungen
So verwenden Sie den „NOT IN“-Filter in Pandas DataFrame

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert