Pandy: jak sprawdzić, czy kolumna zawiera ciąg znaków
Możesz użyć następujących metod, aby sprawdzić, czy kolumna ramki danych pand zawiera ciąg znaków:
Metoda 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg
(df[' col ']. eq (' exact_string ')). any ()
Metoda 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków
df[' col ']. str . contains (' partial_string '). any ()
Metoda 3: Zliczanie częściowych wystąpień ciągu w kolumnie
df[' col ']. str . contains (' partial_string '). sum ()
W tym samouczku wyjaśniono, jak w praktyce używać każdej metody z następującą ramką DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
Przykład 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg
Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie konferencyjnej ramki DataFrame istnieje dokładny ciąg „Eas”:
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
Dane wyjściowe zwracają False , co informuje nas, że dokładny ciąg „Eas” nie istnieje w kolumnie konferencyjnej ramki DataFrame.
Przykład 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków
Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie konferencyjnej ramki DataFrame istnieje częściowy ciąg „Eas”:
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
Dane wyjściowe zwracają True , co informuje nas, że częściowy ciąg „Eas” istnieje w kolumnie konferencyjnej ramki DataFrame.
Przykład 3: Zliczanie wystąpień częściowego ciągu w kolumnie
Poniższy kod pokazuje, jak policzyć, ile razy częściowy ciąg „Eas” pojawia się w kolumnie konferencyjnej ramki DataFrame:
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
Dane wyjściowe zwracają wartość 3 , która informuje nas, że częściowy ciąg „Eas” pojawia się 3 razy w kolumnie konferencyjnej ramki DataFrame.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:
Jak usunąć wiersze w Pandas DataFrame na podstawie warunku
Jak filtrować ramkę danych Pandas pod wieloma warunkami
Jak korzystać z filtra „NIE W” w Pandas DataFrame