Pandas: selecione linhas onde duas colunas são iguais
Você pode usar os seguintes métodos para selecionar linhas em um DataFrame do pandas onde duas colunas são (ou não) iguais:
Método 1: selecione linhas onde duas colunas são iguais
df. query (' column1 ==column2 ')
Método 2: selecione linhas nas quais duas colunas não são iguais
df. query (' column1 !=column2 ')
Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'], ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'], ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']}) #view DataFrame print (df) painting rater1 rater2 0 A Good Good 1 B Good Bad 2 C Bad Bad 3 D Bad Good 4 E Good Good 5 F Good Good
Exemplo 1: Selecione linhas onde duas colunas são iguais
Podemos usar a seguinte sintaxe para selecionar apenas as linhas do DataFrame onde os valores das colunas rater1 e rater2 são iguais:
#select rows where rater1 is equal to rater2 df. query (' rater1 ==rater2 ') painting rater1 rater2 0 A Good Good 2 C Bad Bad 4 E Good Good 5 F Good Good
Observe que apenas as linhas onde miss1 e miss2 são iguais são selecionadas.
Também poderíamos usar a função len() se quisermos simplesmente contar quantas linhas têm valores iguais nas colunas rater1 e rater2 :
#count the number of rows where rater1 is equal to rater2 len ( df.query (' rater1 ==rater2 ')) 4
Isso nos diz que existem 4 linhas onde os valores das colunas miss1 e miss2 são iguais.
Exemplo 2: Selecione linhas nas quais duas colunas não são iguais
Podemos usar a seguinte sintaxe para selecionar apenas as linhas no DataFrame onde os valores das colunas rater1 e rater2 não são iguais:
#select rows where rater1 is not equal to rater2 df. query (' rater1 !=rater2 ') painting rater1 rater2 1 B Good Bad 3 D Bad Good
Observe que apenas as linhas onde miss1 e miss2 não são iguais são selecionadas.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Como renomear colunas no Pandas
Como adicionar uma coluna a um DataFrame do Pandas
Como alterar a ordem das colunas no Pandas DataFrame