Pandas: wählen sie zeilen aus, in denen zwei spalten gleich sind


Sie können die folgenden Methoden verwenden, um Zeilen in einem Pandas-DataFrame auszuwählen, in denen zwei Spalten gleich sind (oder nicht):

Methode 1: Wählen Sie Zeilen aus, in denen zwei Spalten gleich sind

 df. query (' column1 ==column2 ')

Methode 2: Wählen Sie Zeilen aus, in denen zwei Spalten ungleich sind

 df. query (' column1 !=column2 ')

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' painting ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' fail1 ': ['Good', 'Good', 'Bad', 'Bad', 'Good', 'Good'],
                   ' fail2 ': ['Good', 'Bad', 'Bad', 'Good', 'Good', 'Good']})

#view DataFrame
print (df)

  painting rater1 rater2
0 A Good Good
1 B Good Bad
2 C Bad Bad
3 D Bad Good
4 E Good Good
5 F Good Good

Beispiel 1: Wählen Sie Zeilen aus, in denen zwei Spalten gleich sind

Wir können die folgende Syntax verwenden, um nur die Zeilen im DataFrame auszuwählen, in denen die Werte der Spalten rater1 und rater2 gleich sind:

 #select rows where rater1 is equal to rater2
df. query (' rater1 ==rater2 ')

 painting rater1 rater2
0 A Good Good
2 C Bad Bad
4 E Good Good
5 F Good Good

Beachten Sie, dass nur Zeilen ausgewählt werden, in denen miss1 und miss2 gleich sind.

Wir könnten auch die Funktion len() verwenden, wenn wir einfach zählen möchten, wie viele Zeilen gleiche Werte in den Spalten rater1 und rater2 haben:

 #count the number of rows where rater1 is equal to rater2
len ( df.query (' rater1 ==rater2 '))

4

Dies sagt uns, dass es 4 Zeilen gibt, in denen die Werte der Spalten miss1 und miss2 gleich sind.

Beispiel 2: Wählen Sie Zeilen aus, in denen zwei Spalten ungleich sind

Wir können die folgende Syntax verwenden, um nur die Zeilen im DataFrame auszuwählen, in denen die Werte der Spalten rater1 und rater2 nicht gleich sind:

 #select rows where rater1 is not equal to rater2
df. query (' rater1 !=rater2 ')

 painting rater1 rater2
1 B Good Bad
3 D Bad Good

Beachten Sie, dass nur Zeilen ausgewählt werden, in denen miss1 und miss2 nicht gleich sind.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So benennen Sie Spalten in Pandas um
So fügen Sie einem Pandas DataFrame eine Spalte hinzu
So ändern Sie die Spaltenreihenfolge in Pandas DataFrame

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert