Como usar o operador “or” no pandas (com exemplos)


Você pode usar o | símbolo como um operador “OR” em pandas.

Por exemplo, você pode usar a seguinte sintaxe básica para filtrar linhas em um DataFrame do pandas que satisfaça a condição 1 ou a condição 2:

 df[(condition1) | (condition2)]

Os exemplos a seguir mostram como usar esse operador “OR” em diferentes cenários.

Exemplo 1: Use o operador “OR” para filtrar linhas com base em valores numéricos no Pandas

Suponha que temos o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

        team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Podemos usar a seguinte sintaxe para filtrar linhas no DataFrame onde o valor na coluna de pontos é maior que 20 ou o valor na coluna de assistências é igual a 9:

 #filter rows where points > 20 or assists = 9
df[(df. points > 20) | (df. assists == 9)]

        team points assists rebounds
0 to 25 5 11
3 B 14 9 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

As únicas linhas retornadas são aquelas onde o valor dos pontos é maior que 20 ou o valor das assistências é igual a 9.

Exemplo 2: Use o operador “OR” para filtrar linhas com base em valores de string em Pandas

Suponha que temos o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' position ': ['G', 'G', 'F', 'F', 'C', 'F', 'C', 'C'],
                   ' conference ': ['W', 'W', 'W', 'W', 'E', 'E', 'E', 'E'],
                   ' points ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team position conference points
0 AGW 11
1 BGW 8
2 CFW 10
3DFW 6
4 ECE 6
5 FFE 5
6 GCE 9
7 HCE 12

Podemos usar a seguinte sintaxe para filtrar linhas no DataFrame onde o valor na coluna de posição é igual a G ou o valor na coluna de posição é igual a F ou o valor na coluna da equipe é igual a H:

 #filter rows based on string values
df[( df.team == ' H ') | (df. position == ' G ') | (df. position == ' F ')]

     team position conference points
0 A G W 11
1 B G W 8
2 C F W 10
3 D F W 6
5 F F E 5
7 H C E 12

As únicas linhas retornadas são aquelas que atendem a pelo menos uma das três condições especificadas.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como filtrar um DataFrame do Pandas por valores de coluna
Como filtrar linhas do Pandas DataFrame por data
Como filtrar um DataFrame do Pandas em múltiplas condições

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *