Pandas: удалять строки на основе нескольких условий


Вы можете использовать следующие методы для удаления строк на основе нескольких условий в DataFrame pandas:

Способ 1. Удаление строк, соответствующих одному из нескольких условий.

 df = df. loc [ ~ ((df[' col1 '] == ' A ') | (df[' col2 '] > 6 ))]

В этом конкретном примере будут удалены все строки, где значение col1 равно A или значение col2 больше 6.

Способ 2. Удаление строк, соответствующих нескольким условиям.

 df = df. loc [ ~ ((df[' col1 '] == ' A ') & (df[' col2 '] > 6 ))] 

В этом конкретном примере будут удалены все строки, где значение col1 равно A , а значение col2 больше 6.

В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' pos ': ['G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'],
                   ' assists ': [5, 7, 7, 9, 12, 9, 3, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team pos assists rebounds
0 A G 5 11
1 A G 7 8
2 A F 7 10
3 A F 9 6
4 B G 12 6
5 B G 9 5
6 B F 3 9
7 B F 4 12

Пример 1. Удаление строк, соответствующих одному из нескольких условий

Следующий код показывает, как удалить строки в DataFrame, где значение в столбце «Команда » равно A или значение в столбце «Посещаемость» больше 6:

 #drop rows where value in team column == 'A' or value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') | (df[' assists '] > 6 ))]

#view updated DataFrame
print (df)

  team pos assists rebounds
6 BF 3 9
7 BF 4 12

Обратите внимание, что все строки, в которых столбец команды был равен A или столбец передач был больше 6, были удалены.

Для этого конкретного DataFrame шесть строк были удалены.

Примечание : | символ представляет логику «ИЛИ» в пандах.

Пример 2. Удаление строк, соответствующих нескольким условиям

Следующий код показывает, как удалить строки в DataFrame, где значение в столбце «Команда » равно A , а значение в столбце « Посещаемость» больше 6:

 #drop rows where value in team column == 'A' and value in assists column > 6
df = df. loc [ ~ ((df[' team '] == ' A ') & (df[' assists '] > 6 ))]

#view updated DataFrame
print (df)

  team pos assists rebounds
0 AG 5 11
4 BG 12 6
5 BG 9 5
6 BF 3 9
7 BF 4 12

Обратите внимание, что все строки, в которых столбец команд был равен A, а столбец передач был больше 6, были удалены.

Для этого конкретного DataFrame три строки были удалены.

Примечание . Символ & представляет логику «И» в пандах.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:

Как удалить строки, содержащие определенное значение в Pandas
Как удалить строки, содержащие определенную строку в Pandas
Как удалить строки по индексу в Pandas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *