Pandas: как проверить, содержит ли столбец строку
Вы можете использовать следующие методы, чтобы проверить, содержит ли столбец DataFrame pandas строку:
Способ 1. Проверьте, существует ли в столбце точная строка.
(df[' col ']. eq (' exact_string ')). any ()
Способ 2: проверьте, существует ли в столбце частичная строка
df[' col ']. str . contains (' partial_string '). any ()
Способ 3: подсчитать вхождения частичных строк в столбце
df[' col ']. str . contains (' partial_string '). sum ()
В этом руководстве объясняется, как использовать каждый метод на практике со следующим DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
Пример 1. Проверьте, существует ли в столбце точная строка
Следующий код показывает, как проверить, существует ли точная строка «Eas» в столбце конференции DataFrame:
#check if exact string 'Eas' exists in conference column (df[' conference ']. eq (' Eas ')). any () False
Выходные данные возвращают False , что сообщает нам, что точная строка «Eas» не существует в столбце конференции DataFrame.
Пример 2. Проверьте, существует ли в столбце неполная строка
Следующий код показывает, как проверить, существует ли частичная строка «Eas» в столбце конференции DataFrame:
#check if partial string 'Eas' exists in conference column df[' conference ']. str . contains (' Eas '). any () True
Выходные данные возвращают True , что говорит нам о том, что частичная строка «Eas» существует в столбце конференции DataFrame.
Пример 3. Подсчет вхождений частичной строки в столбец
Следующий код показывает, как подсчитать количество раз, когда частичная строка «Eas» появляется в столбце конференции DataFrame:
#count occurrences of partial string 'Eas' in conference column df[' conference ']. str . contains (' East '). sum () 3
Выходные данные возвращают 3 , что говорит нам о том, что частичная строка «Eas» появляется 3 раза в столбце конференции DataFrame.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Как удалить строки в Pandas DataFrame в зависимости от условия
Как фильтровать DataFrame Pandas по нескольким условиям
Как использовать фильтр «НЕ В» в Pandas DataFrame