Pandy: wybierz wiersze, w których dwie kolumny są równe


Możesz użyć następujących metod, aby wybrać wiersze w ramce danych pandy, w której dwie kolumny są (lub nie) równe:

Metoda 1: Wybierz wiersze, w których dwie kolumny są równe

 df. query (' column1 ==column2 ')

Metoda 2: Wybierz wiersze, w których dwie kolumny nie są równe

 df. query (' column1 !=column2 ')

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'],
                   ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']})

#view DataFrame
print (df)

  painting rater1 rater2
0 A Good Good
1 B Good Bad
2 C Bad Bad
3 D Bad Good
4 E Good Good
5 F Good Good

Przykład 1: Wybierz wiersze, w których dwie kolumny są równe

Możemy zastosować następującą składnię, aby wybrać tylko te wiersze w DataFrame, w których wartości kolumn oceniający1 i oceniający2 są równe:

 #select rows where rater1 is equal to rater2
df. query (' rater1 ==rater2 ')

 painting rater1 rater2
0 A Good Good
2 C Bad Bad
4 E Good Good
5 F Good Good

Należy pamiętać, że wybierane są tylko linie, w których brak1 i brak2 są równe.

Moglibyśmy również użyć funkcji len() jeśli chcemy po prostu policzyć, ile wierszy ma równe wartości w kolumnach oceniający1 i oceniający2 :

 #count the number of rows where rater1 is equal to rater2
len ( df.query (' rater1 ==rater2 '))

4

To mówi nam, że istnieją 4 wiersze, w których wartości kolumn miss1 i miss2 są równe.

Przykład 2: Wybierz wiersze, w których dwie kolumny nie są równe

Możemy zastosować następującą składnię, aby wybrać tylko te wiersze w DataFrame, w których wartości kolumn oceniający1 i oceniający2 nie są równe:

 #select rows where rater1 is not equal to rater2
df. query (' rater1 !=rater2 ')

 painting rater1 rater2
1 B Good Bad
3 D Bad Good

Należy pamiętać, że wybierane są tylko linie, w których brak1 i brak2 nie są równe.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak zmienić nazwy kolumn w Pandach
Jak dodać kolumnę do ramki danych Pandas
Jak zmienić kolejność kolumn w Pandas DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *