Панды: как найти первую строку, соответствующую критериям
Вы можете использовать следующий синтаксис, чтобы найти первую строку DataFrame pandas, соответствующую определенным критериям:
#get first row where value in 'team' column is equal to 'B' df[df. team == ' B ']. iloc [0] #get index of first row where value in 'team' column is equal to 'B' df[df. team == ' B ']. index [0]
В следующих примерах показано, как использовать этот синтаксис на практике со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'], ' points ': [18, 13, 19, 14, 24, 21, 20, 28], ' assists ': [5, 7, 17, 9, 12, 9, 5, 12]}) #view DataFrame print (df) team points assists 0 to 18 5 1 to 13 7 2 A 19 17 3 B 14 9 4 B 24 12 5 C 21 9 6 C 20 5 7 C 28 12
Пример 1. Найдите первую строку, соответствующую критерию
Мы можем использовать следующий синтаксис, чтобы найти первую строку, в которой значение в столбце команды равно «B»:
#find first row where team is equal to 'B' df[df. team == ' B ']. iloc [0] team B points 14 assists 9 Name: 3, dtype: object #find index of first row where team is equal to 'B' df[df. team == ' B ']. index [0] 3
Мы видим, что первая строка, где значение в столбце команды равно «B», находится на позиции индекса 3.
Пример 2. Найдите первую строку, соответствующую нескольким критериям.
Мы можем использовать следующий синтаксис, чтобы найти первую строку, в которой значение в столбце очков больше 15, а значение в столбце передач больше 10:
#find first row where points > 15 and assists > 10 df[(df. points > 15) & (df. assists > 10)]. iloc [0] team A points 19 assists 17 Name: 2, dtype: object #find index of first row where points > 15 and assists > 10 df[(df. points > 15) & (df. assists > 10)]. index [0] 2
Мы видим, что первая строка, где значение в столбце очков больше 15, а значение в столбце передач больше 10, находится в позиции индекса 2.
Пример 3. Найдите первую строку, соответствующую одному из многих критериев.
Мы можем использовать следующий синтаксис, чтобы найти первую строку, в которой значение в столбце очков больше 15 или значение в столбце передач больше 10:
#find first row where points > 15 or assists > 10 df[(df. points > 15) | (df. assists > 10)]. iloc [0] team A points 18 assists 5 Name: 0, dtype: object #find index of first row where points > 15 or assists > 10 df[(df. points > 15) | (df. assists > 10)]. index [0] 0
Мы видим, что первая строка, где значение в столбце очков больше 15 или значение в столбце передач больше 10, находится в позиции индекса 0.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как выбрать строки без значений NaN в Pandas
Как выбрать строки на основе значений столбца в Pandas
Как выбрать отдельные строки в Pandas