Pandas: so überprüfen sie, ob zwei dataframes gleich sind
Sie können die folgende grundlegende Syntax verwenden, um zu überprüfen, ob zwei Pandas-DataFrames gleich sind:
df1. equals (df2)
Dies gibt den Wert True oder False zurück.
Wenn zwei DataFrames nicht gleich sind, können Sie die folgende Syntax verwenden, um Zeilen im zweiten DataFrame zu finden, die im ersten DataFrame nicht vorhanden sind:
#perform outer join on two DataFrames all_df = df1. merge (df2, indicator= True , how=' outer ') #find which rows only exist in second DataFrame only_df2 = all_df[all_df[' _merge '] == ' right_only '] only_df2 = only_df2. drop (' _merge ', axis= 1 )
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Überprüfen Sie, ob zwei Pandas-DataFrames gleich sind
Nehmen wir an, wir haben die folgenden zwei Panda-DataFrames:
import pandas as pd #create first DataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [12, 15, 22, 29, 24]}) print (df1) team points 0 to 12 1 B 15 2 C 22 3 D 29 4 E 24 #create second DataFrame df2 = pd. DataFrame ({' team ': ['A', 'D', 'F', 'G', 'H'], ' points ': [12, 29, 15, 19, 10]}) print (df2) team points 0 to 12 1 D 29 2 F 15 3 G 19 4:10 a.m.
Mit der folgenden Syntax können wir prüfen, ob die beiden DataFrames gleich sind:
#check if two DataFrames are equal df1. equals (df2) False
Die Ausgabe gibt False zurück, was bedeutet, dass die beiden DataFrames nicht gleich sind.
Mit der folgenden Syntax können wir dann herausfinden, welche Zeilen im zweiten DataFrame, aber nicht im ersten vorhanden sind:
#perform outer join on two DataFrames all_df = df1. merge (df2, indicator= True , how=' outer ') #find which rows only exist in second DataFrame only_df2 = all_df[all_df[' _merge '] == ' right_only '] only_df2 = only_df2. drop (' _merge ', axis= 1 ) #view results print (only_df2) team points 5 F 15 6 G 19 7:10 a.m.
Aus dem Ergebnis können wir erkennen, dass es im zweiten DataFrame drei Zeilen gibt, die im ersten DataFrame nicht vorhanden sind.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:
Pandas: Fügen Sie eine Spalte von einem DataFrame zu einem anderen hinzu
Pandas: Zeilen abrufen, die sich nicht in einem anderen DataFrame befinden
Pandas: So überprüfen Sie, ob mehrere Spalten gleich sind