Pandas: удалять строки на основе нескольких условий
Вы можете использовать следующие методы для удаления строк на основе нескольких условий в DataFrame pandas:
Способ 1. Удаление строк, соответствующих одному из нескольких условий.
df = df. loc [ ~ ((df[' col1 '] == ' A ') | (df[' col2 '] > 6 ))]
В этом конкретном примере будут удалены все строки, где значение col1 равно A или значение col2 больше 6.
Способ 2. Удаление строк, соответствующих нескольким условиям.
df = df. loc [ ~ ((df[' col1 '] == ' A ') & (df[' col2 '] > 6 ))]
В этом конкретном примере будут удалены все строки, где значение col1 равно A , а значение col2 больше 6.
В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' pos ': ['G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'], ' assists ': [5, 7, 7, 9, 12, 9, 3, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team pos assists rebounds 0 A G 5 11 1 A G 7 8 2 A F 7 10 3 A F 9 6 4 B G 12 6 5 B G 9 5 6 B F 3 9 7 B F 4 12
Пример 1. Удаление строк, соответствующих одному из нескольких условий
Следующий код показывает, как удалить строки в DataFrame, где значение в столбце «Команда » равно A или значение в столбце «Посещаемость» больше 6:
#drop rows where value in team column == 'A' or value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') | (df[' assists '] > 6 ))]
#view updated DataFrame
print (df)
team pos assists rebounds
6 BF 3 9
7 BF 4 12
Обратите внимание, что все строки, в которых столбец команды был равен A или столбец передач был больше 6, были удалены.
Для этого конкретного DataFrame шесть строк были удалены.
Примечание : | символ представляет логику «ИЛИ» в пандах.
Пример 2. Удаление строк, соответствующих нескольким условиям
Следующий код показывает, как удалить строки в DataFrame, где значение в столбце «Команда » равно A , а значение в столбце « Посещаемость» больше 6:
#drop rows where value in team column == 'A' and value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') & (df[' assists '] > 6 ))]
#view updated DataFrame
print (df)
team pos assists rebounds
0 AG 5 11
4 BG 12 6
5 BG 9 5
6 BF 3 9
7 BF 4 12
Обратите внимание, что все строки, в которых столбец команд был равен A, а столбец передач был больше 6, были удалены.
Для этого конкретного DataFrame три строки были удалены.
Примечание . Символ & представляет логику «И» в пандах.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Как удалить строки, содержащие определенное значение в Pandas
Как удалить строки, содержащие определенную строку в Pandas
Как удалить строки по индексу в Pandas