Pandas: so überprüfen sie, ob zwei dataframes gleich sind


Sie können die folgende grundlegende Syntax verwenden, um zu überprüfen, ob zwei Pandas-DataFrames gleich sind:

 df1. equals (df2)

Dies gibt den Wert True oder False zurück.

Wenn zwei DataFrames nicht gleich sind, können Sie die folgende Syntax verwenden, um Zeilen im zweiten DataFrame zu finden, die im ersten DataFrame nicht vorhanden sind:

 #perform outer join on two DataFrames
all_df = df1. merge (df2, indicator= True , how=' outer ')

#find which rows only exist in second DataFrame
only_df2 = all_df[all_df[' _merge '] == ' right_only ']
only_df2 = only_df2. drop (' _merge ', axis= 1 )

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Überprüfen Sie, ob zwei Pandas-DataFrames gleich sind

Nehmen wir an, wir haben die folgenden zwei Panda-DataFrames:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], 
                    ' points ': [12, 15, 22, 29, 24]}) 

print (df1)

  team points
0 to 12
1 B 15
2 C 22
3 D 29
4 E 24

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'D', 'F', 'G', 'H'],
                    ' points ': [12, 29, 15, 19, 10]})

print (df2)

  team points
0 to 12
1 D 29
2 F 15
3 G 19
4:10 a.m.

Mit der folgenden Syntax können wir prüfen, ob die beiden DataFrames gleich sind:

 #check if two DataFrames are equal
df1. equals (df2)

False

Die Ausgabe gibt False zurück, was bedeutet, dass die beiden DataFrames nicht gleich sind.

Mit der folgenden Syntax können wir dann herausfinden, welche Zeilen im zweiten DataFrame, aber nicht im ersten vorhanden sind:

 #perform outer join on two DataFrames
all_df = df1. merge (df2, indicator= True , how=' outer ')

#find which rows only exist in second DataFrame
only_df2 = all_df[all_df[' _merge '] == ' right_only ']
only_df2 = only_df2. drop (' _merge ', axis= 1 )

#view results
print (only_df2)

  team points
5 F 15
6 G 19
7:10 a.m.

Aus dem Ergebnis können wir erkennen, dass es im zweiten DataFrame drei Zeilen gibt, die im ersten DataFrame nicht vorhanden sind.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

Pandas: Fügen Sie eine Spalte von einem DataFrame zu einem anderen hinzu
Pandas: Zeilen abrufen, die sich nicht in einem anderen DataFrame befinden
Pandas: So überprüfen Sie, ob mehrere Spalten gleich sind

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert