Pandas: selecione linhas onde duas colunas são iguais


Você pode usar os seguintes métodos para selecionar linhas em um DataFrame do pandas onde duas colunas são (ou não) iguais:

Método 1: selecione linhas onde duas colunas são iguais

 df. query (' column1 ==column2 ')

Método 2: selecione linhas nas quais duas colunas não são iguais

 df. query (' column1 !=column2 ')

Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'],
                   ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']})

#view DataFrame
print (df)

  painting rater1 rater2
0 A Good Good
1 B Good Bad
2 C Bad Bad
3 D Bad Good
4 E Good Good
5 F Good Good

Exemplo 1: Selecione linhas onde duas colunas são iguais

Podemos usar a seguinte sintaxe para selecionar apenas as linhas do DataFrame onde os valores das colunas rater1 e rater2 são iguais:

 #select rows where rater1 is equal to rater2
df. query (' rater1 ==rater2 ')

 painting rater1 rater2
0 A Good Good
2 C Bad Bad
4 E Good Good
5 F Good Good

Observe que apenas as linhas onde miss1 e miss2 são iguais são selecionadas.

Também poderíamos usar a função len() se quisermos simplesmente contar quantas linhas têm valores iguais nas colunas rater1 e rater2 :

 #count the number of rows where rater1 is equal to rater2
len ( df.query (' rater1 ==rater2 '))

4

Isso nos diz que existem 4 linhas onde os valores das colunas miss1 e miss2 são iguais.

Exemplo 2: Selecione linhas nas quais duas colunas não são iguais

Podemos usar a seguinte sintaxe para selecionar apenas as linhas no DataFrame onde os valores das colunas rater1 e rater2 não são iguais:

 #select rows where rater1 is not equal to rater2
df. query (' rater1 !=rater2 ')

 painting rater1 rater2
1 B Good Bad
3 D Bad Good

Observe que apenas as linhas onde miss1 e miss2 não são iguais são selecionadas.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Como renomear colunas no Pandas
Como adicionar uma coluna a um DataFrame do Pandas
Como alterar a ordem das colunas no Pandas DataFrame

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *