Panda's: selecteer rijen waarbij twee kolommen gelijk zijn


U kunt de volgende methoden gebruiken om rijen in een Panda DataFrame te selecteren waarbij twee kolommen gelijk (of niet) gelijk zijn:

Methode 1: Selecteer rijen waarbij twee kolommen gelijk zijn

 df. query (' column1 ==column2 ')

Methode 2: Selecteer rijen waarin twee kolommen niet gelijk zijn

 df. query (' column1 !=column2 ')

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'],
                   ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']})

#view DataFrame
print (df)

  painting rater1 rater2
0 A Good Good
1 B Good Bad
2 C Bad Bad
3 D Bad Good
4 E Good Good
5 F Good Good

Voorbeeld 1: Selecteer rijen waarbij twee kolommen gelijk zijn

We kunnen de volgende syntaxis gebruiken om alleen de rijen in het DataFrame te selecteren waar de waarden van de kolommen rater1 en rater2 gelijk zijn:

 #select rows where rater1 is equal to rater2
df. query (' rater1 ==rater2 ')

 painting rater1 rater2
0 A Good Good
2 C Bad Bad
4 E Good Good
5 F Good Good

Merk op dat alleen lijnen waarbij miss1 en miss2 gelijk zijn, worden geselecteerd.

We kunnen ook de functie len() gebruiken als we eenvoudigweg willen tellen hoeveel rijen gelijke waarden hebben in de kolommen rater1 en rater2 :

 #count the number of rows where rater1 is equal to rater2
len ( df.query (' rater1 ==rater2 '))

4

Dit vertelt ons dat er 4 rijen zijn waarin de waarden van de kolommen miss1 en miss2 gelijk zijn.

Voorbeeld 2: Selecteer rijen waarin twee kolommen niet gelijk zijn

We kunnen de volgende syntaxis gebruiken om alleen die rijen in het DataFrame te selecteren waar de waarden van de kolommen rater1 en rater2 niet gelijk zijn:

 #select rows where rater1 is not equal to rater2
df. query (' rater1 !=rater2 ')

 painting rater1 rater2
1 B Good Bad
3 D Bad Good

Merk op dat alleen lijnen waarbij miss1 en miss2 niet gelijk zijn, worden geselecteerd.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe kolommen te hernoemen in Pandas
Hoe u een kolom toevoegt aan een Pandas DataFrame
Hoe u de kolomvolgorde in Pandas DataFrame kunt wijzigen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert