Panda: seleziona le righe in cui due colonne sono uguali
È possibile utilizzare i seguenti metodi per selezionare le righe in un DataFrame panda in cui due colonne sono (o non sono) uguali:
Metodo 1: seleziona le righe in cui due colonne sono uguali
df. query (' column1 ==column2 ')
Metodo 2: seleziona le righe in cui due colonne non sono uguali
df. query (' column1 !=column2 ')
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'], ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'], ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']}) #view DataFrame print (df) painting rater1 rater2 0 A Good Good 1 B Good Bad 2 C Bad Bad 3 D Bad Good 4 E Good Good 5 F Good Good
Esempio 1: seleziona le righe in cui due colonne sono uguali
Possiamo utilizzare la seguente sintassi per selezionare solo le righe nel DataFrame in cui i valori delle colonne rater1 e rater2 sono uguali:
#select rows where rater1 is equal to rater2 df. query (' rater1 ==rater2 ') painting rater1 rater2 0 A Good Good 2 C Bad Bad 4 E Good Good 5 F Good Good
Tieni presente che vengono selezionate solo le righe in cui miss1 e miss2 sono uguali.
Potremmo anche utilizzare la funzione len() se vogliamo semplicemente contare quante righe hanno valori uguali nelle colonne rater1 e rater2 :
#count the number of rows where rater1 is equal to rater2 len ( df.query (' rater1 ==rater2 ')) 4
Questo ci dice che ci sono 4 righe in cui i valori delle colonne miss1 e miss2 sono uguali.
Esempio 2: selezionare le righe in cui due colonne non sono uguali
Possiamo utilizzare la seguente sintassi per selezionare solo quelle righe nel DataFrame in cui i valori delle colonne rater1 e rater2 non sono uguali:
#select rows where rater1 is not equal to rater2 df. query (' rater1 !=rater2 ') painting rater1 rater2 1 B Good Bad 3 D Bad Good
Tieni presente che vengono selezionate solo le righe in cui miss1 e miss2 non sono uguali.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Come rinominare le colonne in Pandas
Come aggiungere una colonna a un DataFrame Pandas
Come modificare l’ordine delle colonne in Pandas DataFrame