Панды: как найти первую строку, соответствующую критериям


Вы можете использовать следующий синтаксис, чтобы найти первую строку DataFrame pandas, соответствующую определенным критериям:

 #get first row where value in 'team' column is equal to 'B'
df[df. team == ' B ']. iloc [0]

#get index of first row where value in 'team' column is equal to 'B'
df[df. team == ' B ']. index [0]

В следующих примерах показано, как использовать этот синтаксис на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [18, 13, 19, 14, 24, 21, 20, 28],
                   ' assists ': [5, 7, 17, 9, 12, 9, 5, 12]})

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 to 13 7
2 A 19 17
3 B 14 9
4 B 24 12
5 C 21 9
6 C 20 5
7 C 28 12

Пример 1. Найдите первую строку, соответствующую критерию

Мы можем использовать следующий синтаксис, чтобы найти первую строку, в которой значение в столбце команды равно «B»:

 #find first row where team is equal to 'B'
df[df. team == ' B ']. iloc [0]

team B
points 14
assists 9
Name: 3, dtype: object

#find index of first row where team is equal to 'B'
df[df. team == ' B ']. index [0]

3

Мы видим, что первая строка, где значение в столбце команды равно «B», находится на позиции индекса 3.

Пример 2. Найдите первую строку, соответствующую нескольким критериям.

Мы можем использовать следующий синтаксис, чтобы найти первую строку, в которой значение в столбце очков больше 15, а значение в столбце передач больше 10:

 #find first row where points > 15 and assists > 10
df[(df. points > 15) & (df. assists > 10)]. iloc [0]

team A
points 19
assists 17
Name: 2, dtype: object

#find index of first row where points > 15 and assists > 10
df[(df. points > 15) & (df. assists > 10)]. index [0]

2

Мы видим, что первая строка, где значение в столбце очков больше 15, а значение в столбце передач больше 10, находится в позиции индекса 2.

Пример 3. Найдите первую строку, соответствующую одному из многих критериев.

Мы можем использовать следующий синтаксис, чтобы найти первую строку, в которой значение в столбце очков больше 15 или значение в столбце передач больше 10:

 #find first row where points > 15 or assists > 10
df[(df. points > 15) | (df. assists > 10)]. iloc [0]

team A
points 18
assists 5
Name: 0, dtype: object

#find index of first row where points > 15 or assists > 10
df[(df. points > 15) | (df. assists > 10)]. index [0]

0

Мы видим, что первая строка, где значение в столбце очков больше 15 или значение в столбце передач больше 10, находится в позиции индекса 0.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:

Как выбрать строки без значений NaN в Pandas
Как выбрать строки на основе значений столбца в Pandas
Как выбрать отдельные строки в Pandas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *