Pandy: jak sprawdzić, czy kolumna zawiera ciąg znaków


Możesz użyć następujących metod, aby sprawdzić, czy kolumna ramki danych pand zawiera ciąg znaków:

Metoda 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg

 (df[' col ']. eq (' exact_string ')). any ()

Metoda 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków

 df[' col ']. str . contains (' partial_string '). any ()

Metoda 3: Zliczanie częściowych wystąpień ciągu w kolumnie

 df[' col ']. str . contains (' partial_string '). sum ()

W tym samouczku wyjaśniono, jak w praktyce używać każdej metody z następującą ramką DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Przykład 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg

Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie konferencyjnej ramki DataFrame istnieje dokładny ciąg „Eas”:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

Dane wyjściowe zwracają False , co informuje nas, że dokładny ciąg „Eas” nie istnieje w kolumnie konferencyjnej ramki DataFrame.

Przykład 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków

Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie konferencyjnej ramki DataFrame istnieje częściowy ciąg „Eas”:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

Dane wyjściowe zwracają True , co informuje nas, że częściowy ciąg „Eas” istnieje w kolumnie konferencyjnej ramki DataFrame.

Przykład 3: Zliczanie wystąpień częściowego ciągu w kolumnie

Poniższy kod pokazuje, jak policzyć, ile razy częściowy ciąg „Eas” pojawia się w kolumnie konferencyjnej ramki DataFrame:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

Dane wyjściowe zwracają wartość 3 , która informuje nas, że częściowy ciąg „Eas” pojawia się 3 razy w kolumnie konferencyjnej ramki DataFrame.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Jak usunąć wiersze w Pandas DataFrame na podstawie warunku
Jak filtrować ramkę danych Pandas pod wieloma warunkami
Jak korzystać z filtra „NIE W” w Pandas DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *