Pandas: como encontrar a primeira linha que atende aos critérios
Você pode usar a seguinte sintaxe para encontrar a primeira linha de um DataFrame do pandas que atenda a critérios específicos:
#get first row where value in 'team' column is equal to 'B' df[df. team == ' B ']. iloc [0] #get index of first row where value in 'team' column is equal to 'B' df[df. team == ' B ']. index [0]
Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'], ' points ': [18, 13, 19, 14, 24, 21, 20, 28], ' assists ': [5, 7, 17, 9, 12, 9, 5, 12]}) #view DataFrame print (df) team points assists 0 to 18 5 1 to 13 7 2 A 19 17 3 B 14 9 4 B 24 12 5 C 21 9 6 C 20 5 7 C 28 12
Exemplo 1: Encontre a primeira linha que atende a um critério
Podemos usar a seguinte sintaxe para encontrar a primeira linha onde o valor na coluna da equipe é igual a “B”:
#find first row where team is equal to 'B' df[df. team == ' B ']. iloc [0] team B points 14 assists 9 Name: 3, dtype: object #find index of first row where team is equal to 'B' df[df. team == ' B ']. index [0] 3
Podemos ver que a primeira linha onde o valor na coluna da equipe é igual a “B” está na posição 3 do índice.
Exemplo 2: Encontre a primeira linha que atende a vários critérios
Podemos usar a seguinte sintaxe para encontrar a primeira linha onde o valor na coluna de pontos é maior que 15 e o valor na coluna de assistências é maior que 10:
#find first row where points > 15 and assists > 10 df[(df. points > 15) & (df. assists > 10)]. iloc [0] team A points 19 assists 17 Name: 2, dtype: object #find index of first row where points > 15 and assists > 10 df[(df. points > 15) & (df. assists > 10)]. index [0] 2
Podemos ver que a primeira linha onde o valor na coluna de pontos é maior que 15 e o valor na coluna de assistências é maior que 10 está na posição 2 do índice.
Exemplo 3: Encontre a primeira linha que atende a um dos muitos critérios
Podemos usar a seguinte sintaxe para encontrar a primeira linha onde o valor na coluna de pontos é maior que 15 ou o valor na coluna de assistências é maior que 10:
#find first row where points > 15 or assists > 10 df[(df. points > 15) | (df. assists > 10)]. iloc [0] team A points 18 assists 5 Name: 0, dtype: object #find index of first row where points > 15 or assists > 10 df[(df. points > 15) | (df. assists > 10)]. index [0] 0
Podemos ver que a primeira linha onde o valor na coluna de pontos é maior que 15 ou o valor na coluna de assistências é maior que 10 está na posição de índice 0.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Como selecionar linhas sem valores NaN no Pandas
Como selecionar linhas com base nos valores das colunas no Pandas
Como selecionar linhas únicas no Pandas