Pandas: wählen sie zeilen aus, in denen zwei spalten gleich sind
Sie können die folgenden Methoden verwenden, um Zeilen in einem Pandas-DataFrame auszuwählen, in denen zwei Spalten gleich sind (oder nicht):
Methode 1: Wählen Sie Zeilen aus, in denen zwei Spalten gleich sind
df. query (' column1 ==column2 ')
Methode 2: Wählen Sie Zeilen aus, in denen zwei Spalten ungleich sind
df. query (' column1 !=column2 ')
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'], ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'], ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']}) #view DataFrame print (df) painting rater1 rater2 0 A Good Good 1 B Good Bad 2 C Bad Bad 3 D Bad Good 4 E Good Good 5 F Good Good
Beispiel 1: Wählen Sie Zeilen aus, in denen zwei Spalten gleich sind
Wir können die folgende Syntax verwenden, um nur die Zeilen im DataFrame auszuwählen, in denen die Werte der Spalten rater1 und rater2 gleich sind:
#select rows where rater1 is equal to rater2 df. query (' rater1 ==rater2 ') painting rater1 rater2 0 A Good Good 2 C Bad Bad 4 E Good Good 5 F Good Good
Beachten Sie, dass nur Zeilen ausgewählt werden, in denen miss1 und miss2 gleich sind.
Wir könnten auch die Funktion len() verwenden, wenn wir einfach zählen möchten, wie viele Zeilen gleiche Werte in den Spalten rater1 und rater2 haben:
#count the number of rows where rater1 is equal to rater2 len ( df.query (' rater1 ==rater2 ')) 4
Dies sagt uns, dass es 4 Zeilen gibt, in denen die Werte der Spalten miss1 und miss2 gleich sind.
Beispiel 2: Wählen Sie Zeilen aus, in denen zwei Spalten ungleich sind
Wir können die folgende Syntax verwenden, um nur die Zeilen im DataFrame auszuwählen, in denen die Werte der Spalten rater1 und rater2 nicht gleich sind:
#select rows where rater1 is not equal to rater2 df. query (' rater1 !=rater2 ') painting rater1 rater2 1 B Good Bad 3 D Bad Good
Beachten Sie, dass nur Zeilen ausgewählt werden, in denen miss1 und miss2 nicht gleich sind.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:
So benennen Sie Spalten in Pandas um
So fügen Sie einem Pandas DataFrame eine Spalte hinzu
So ändern Sie die Spaltenreihenfolge in Pandas DataFrame