Pandas: como usar o método isin() com o método query()


Freqüentemente, você pode querer usar a função isin() no método query() no pandas para filtrar linhas em um DataFrame onde uma coluna contém um valor em uma lista.

Você pode usar a seguinte sintaxe para fazer isso:

 df. query (' team in ["A", "B", "D"] ')

Esta consulta específica filtra linhas de um DataFrame do pandas onde a coluna da equipe é igual a A, B ou D.

Nota : Precisamos usar in em vez de isin ao usar o método pandas query() .

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Use o método query() para filtrar valores na lista

Suponha que temos o seguinte DataFrame do pandas que contém informações sobre vários jogadores de basquete:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'E'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
4 C 14 12 6
5 C 11 9 5
6 D 20 9 9
7 E 28 4 12

Agora digamos que queremos encontrar linhas onde o valor na coluna da equipe seja igual a A, B ou D.

Podemos usar a seguinte sintaxe para fazer isso:

 #query for rows where team is in list of specific teams
df. query (' team in ["A", "B", "D"] ')

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 9

Observe que a função query() retorna todas as linhas onde o valor na coluna da equipe é igual a A, B ou D.

Observe também que podemos armazenar uma lista de nomes de equipes em uma variável e então referenciar a variável na função query() usando o operador @ :

 #create variable to hold specific team names
team_names = [" A ", " B ", " D "]

#query for rows where team is equal to a team name in team_names variable
df. query (' team in @team_names ')

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 92

A consulta retorna todas as linhas no DataFrame onde team é igual a um dos nomes de equipe armazenados na variável team_names .

Observe que os resultados desta consulta correspondem aos do exemplo anterior.

Nota : Você pode encontrar a documentação completa da função query() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Pandas: como filtrar linhas com base no comprimento da string
Pandas: como excluir linhas com base na condição
Pandas: como usar o filtro “NO IN”

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *