Pandas: como encontrar a primeira linha que atende aos critérios


Você pode usar a seguinte sintaxe para encontrar a primeira linha de um DataFrame do pandas que atenda a critérios específicos:

 #get first row where value in 'team' column is equal to 'B'
df[df. team == ' B ']. iloc [0]

#get index of first row where value in 'team' column is equal to 'B'
df[df. team == ' B ']. index [0]

Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [18, 13, 19, 14, 24, 21, 20, 28],
                   ' assists ': [5, 7, 17, 9, 12, 9, 5, 12]})

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 to 13 7
2 A 19 17
3 B 14 9
4 B 24 12
5 C 21 9
6 C 20 5
7 C 28 12

Exemplo 1: Encontre a primeira linha que atende a um critério

Podemos usar a seguinte sintaxe para encontrar a primeira linha onde o valor na coluna da equipe é igual a “B”:

 #find first row where team is equal to 'B'
df[df. team == ' B ']. iloc [0]

team B
points 14
assists 9
Name: 3, dtype: object

#find index of first row where team is equal to 'B'
df[df. team == ' B ']. index [0]

3

Podemos ver que a primeira linha onde o valor na coluna da equipe é igual a “B” está na posição 3 do índice.

Exemplo 2: Encontre a primeira linha que atende a vários critérios

Podemos usar a seguinte sintaxe para encontrar a primeira linha onde o valor na coluna de pontos é maior que 15 e o valor na coluna de assistências é maior que 10:

 #find first row where points > 15 and assists > 10
df[(df. points > 15) & (df. assists > 10)]. iloc [0]

team A
points 19
assists 17
Name: 2, dtype: object

#find index of first row where points > 15 and assists > 10
df[(df. points > 15) & (df. assists > 10)]. index [0]

2

Podemos ver que a primeira linha onde o valor na coluna de pontos é maior que 15 e o valor na coluna de assistências é maior que 10 está na posição 2 do índice.

Exemplo 3: Encontre a primeira linha que atende a um dos muitos critérios

Podemos usar a seguinte sintaxe para encontrar a primeira linha onde o valor na coluna de pontos é maior que 15 ou o valor na coluna de assistências é maior que 10:

 #find first row where points > 15 or assists > 10
df[(df. points > 15) | (df. assists > 10)]. iloc [0]

team A
points 18
assists 5
Name: 0, dtype: object

#find index of first row where points > 15 or assists > 10
df[(df. points > 15) | (df. assists > 10)]. index [0]

0

Podemos ver que a primeira linha onde o valor na coluna de pontos é maior que 15 ou o valor na coluna de assistências é maior que 10 está na posição de índice 0.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Como selecionar linhas sem valores NaN no Pandas
Como selecionar linhas com base nos valores das colunas no Pandas
Como selecionar linhas únicas no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *