Pandas: как проверить, содержит ли столбец строку


Вы можете использовать следующие методы, чтобы проверить, содержит ли столбец DataFrame pandas строку:

Способ 1. Проверьте, существует ли в столбце точная строка.

 (df[' col ']. eq (' exact_string ')). any ()

Способ 2: проверьте, существует ли в столбце частичная строка

 df[' col ']. str . contains (' partial_string '). any ()

Способ 3: подсчитать вхождения частичных строк в столбце

 df[' col ']. str . contains (' partial_string '). sum ()

В этом руководстве объясняется, как использовать каждый метод на практике со следующим DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Пример 1. Проверьте, существует ли в столбце точная строка

Следующий код показывает, как проверить, существует ли точная строка «Eas» в столбце конференции DataFrame:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

Выходные данные возвращают False , что сообщает нам, что точная строка «Eas» не существует в столбце конференции DataFrame.

Пример 2. Проверьте, существует ли в столбце неполная строка

Следующий код показывает, как проверить, существует ли частичная строка «Eas» в столбце конференции DataFrame:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

Выходные данные возвращают True , что говорит нам о том, что частичная строка «Eas» существует в столбце конференции DataFrame.

Пример 3. Подсчет вхождений частичной строки в столбец

Следующий код показывает, как подсчитать количество раз, когда частичная строка «Eas» появляется в столбце конференции DataFrame:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

Выходные данные возвращают 3 , что говорит нам о том, что частичная строка «Eas» появляется 3 раза в столбце конференции DataFrame.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как удалить строки в Pandas DataFrame в зависимости от условия
Как фильтровать DataFrame Pandas по нескольким условиям
Как использовать фильтр «НЕ В» в Pandas DataFrame

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *