Pandas: как фильтровать строки на основе значений в списке


Вы можете использовать следующий базовый синтаксис для фильтрации строк в DataFrame pandas, содержащих значение в списке:

 df[df[' team ']. isin ([' A ',' B ',' D '])]

В этом конкретном примере DataFrame будет фильтроваться так, чтобы он содержал только строки, в которых столбец Team равен значению A , B или D.

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: фильтрация DataFrame Pandas на основе значений списка

Предположим, у нас есть следующий DataFrame pandas, содержащий информацию о различных баскетболистах:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
                   
#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
4 C 14 12 6
5 C 11 9 5
6 D 20 9 9
7 D 28 4 12

Теперь предположим, что мы хотим отфильтровать DataFrame, чтобы он содержал только строки, значение которых в столбце команды равно A , B или D.

Для этого мы можем использовать следующий синтаксис:

 #filter for rows where team is equal to 'A', 'B' or 'D'
df[df[' team ']. isin ([' A ',' B ',' D '])]

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 9
7 D 28 4 12

Обратите внимание, что отфильтрованный DataFrame содержит только строки, в которых значение в столбце Team равно A , B или D.

Также обратите внимание, что вы можете использовать функцию isin() для фильтрации по числовым значениям.

Например, мы можем использовать следующий код для фильтрации строк, в которых столбец «ассисты» равен 5 или 9 :

 #filter for rows where assists is equal to 5 or 9
df[df[' assists ']. isin ([ 5,9 ] )]


        team points assists rebounds
0 A 18 5 11
3 B 14 9 6
5 C 11 9 5
6 D 20 9 9

Обратите внимание, что отфильтрованный DataFrame содержит только строки со значением в столбце Assets , равным 5 или 9 .

Примечание . Полную документацию по функции pandas isin() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:

Pandas: как добавить фильтр в сводную таблицу
Панды: как фильтровать «Не содержит»
Pandas: как фильтровать строки, содержащие определенную строку

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *