Pandas: как проверить, существует ли значение в столбце
Вы можете использовать следующие методы, чтобы проверить, существует ли определенное значение в столбце DataFrame pandas:
Способ 1: проверьте, есть ли значение в столбце
22 in df[' my_column ']. values
Способ 2: проверьте, существует ли в столбце какое-либо из нескольких значений
df[' my_column ']. isin ([44, 45, 22]). any ()
В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12
Пример 1. Проверьте, есть ли значение в столбце
Следующий код показывает, как проверить, существует ли значение 22 в столбце точек :
#check if 22 exists in the 'points' column 22 in df[' points ']. values True
Выходные данные возвращают True , что говорит нам о том, что в столбце точек существует значение 22 .
Мы также можем использовать тот же синтаксис со строковыми столбцами.
Например, следующий код показывает, как проверить, существует ли строка «J» в столбце команды :
#check if 'J' exists in the 'team' column 'J' in df[' team ']. values False
Выходные данные возвращают False , что говорит нам о том, что строка «J» не существует в столбце «Команда» .
Пример 2. Проверьте, существует ли в столбце одно из нескольких значений
Следующий код показывает, как проверить, существует ли какое-либо из значений в списке [44, 45, 22] в столбце точек :
#check if 44, 45 or 22 exist in the 'points' column df[' points ']. isin ([44, 45, 22]). any () True
Вывод возвращает True , что говорит нам о том, что по крайней мере одно из значений в списке [44, 45, 22] существует в столбце точек DataFrame.
Мы также можем использовать тот же синтаксис со строковыми столбцами.
Например, следующий код показывает, как проверить, существует ли строка из списка [‘J’, ‘K’, ‘L’] в столбце команды :
#check if J, K, or L exists in the 'team' column df[' team ']. isin ([' J ',' K ',' L ']). any () False
Выходные данные возвращают False , что говорит нам о том, что ни одна из строк в списке не существует в столбце команды .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Как удалить строки в Pandas DataFrame в зависимости от условия
Как фильтровать DataFrame Pandas по нескольким условиям
Как использовать фильтр «НЕ В» в Pandas DataFrame