Panda: seleziona le righe in cui due colonne sono uguali


È possibile utilizzare i seguenti metodi per selezionare le righe in un DataFrame panda in cui due colonne sono (o non sono) uguali:

Metodo 1: seleziona le righe in cui due colonne sono uguali

 df. query (' column1 ==column2 ')

Metodo 2: seleziona le righe in cui due colonne non sono uguali

 df. query (' column1 !=column2 ')

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'],
                   ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']})

#view DataFrame
print (df)

  painting rater1 rater2
0 A Good Good
1 B Good Bad
2 C Bad Bad
3 D Bad Good
4 E Good Good
5 F Good Good

Esempio 1: seleziona le righe in cui due colonne sono uguali

Possiamo utilizzare la seguente sintassi per selezionare solo le righe nel DataFrame in cui i valori delle colonne rater1 e rater2 sono uguali:

 #select rows where rater1 is equal to rater2
df. query (' rater1 ==rater2 ')

 painting rater1 rater2
0 A Good Good
2 C Bad Bad
4 E Good Good
5 F Good Good

Tieni presente che vengono selezionate solo le righe in cui miss1 e miss2 sono uguali.

Potremmo anche utilizzare la funzione len() se vogliamo semplicemente contare quante righe hanno valori uguali nelle colonne rater1 e rater2 :

 #count the number of rows where rater1 is equal to rater2
len ( df.query (' rater1 ==rater2 '))

4

Questo ci dice che ci sono 4 righe in cui i valori delle colonne miss1 e miss2 sono uguali.

Esempio 2: selezionare le righe in cui due colonne non sono uguali

Possiamo utilizzare la seguente sintassi per selezionare solo quelle righe nel DataFrame in cui i valori delle colonne rater1 e rater2 non sono uguali:

 #select rows where rater1 is not equal to rater2
df. query (' rater1 !=rater2 ')

 painting rater1 rater2
1 B Good Bad
3 D Bad Good

Tieni presente che vengono selezionate solo le righe in cui miss1 e miss2 non sono uguali.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come rinominare le colonne in Pandas
Come aggiungere una colonna a un DataFrame Pandas
Come modificare l’ordine delle colonne in Pandas DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *