Panda: come verificare se due dataframe sono uguali
È possibile utilizzare la seguente sintassi di base per verificare se due DataFrames panda sono uguali:
df1. equals (df2)
Ciò restituirà un valore True o False .
Se due DataFrame non sono uguali, puoi utilizzare la seguente sintassi per trovare le righe nel secondo DataFrame che non esistono nel primo DataFrame:
#perform outer join on two DataFrames all_df = df1. merge (df2, indicator= True , how=' outer ') #find which rows only exist in second DataFrame only_df2 = all_df[all_df[' _merge '] == ' right_only '] only_df2 = only_df2. drop (' _merge ', axis= 1 )
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: controlla se due DataFrames panda sono uguali
Supponiamo di avere i seguenti due DataFrames panda:
import pandas as pd #create first DataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [12, 15, 22, 29, 24]}) print (df1) team points 0 to 12 1 B 15 2 C 22 3 D 29 4 E 24 #create second DataFrame df2 = pd. DataFrame ({' team ': ['A', 'D', 'F', 'G', 'H'], ' points ': [12, 29, 15, 19, 10]}) print (df2) team points 0 to 12 1 D 29 2 F 15 3 G 19 4:10 a.m.
Possiamo usare la seguente sintassi per verificare se i due DataFrame sono uguali:
#check if two DataFrames are equal df1. equals (df2) False
L’output restituisce False , il che significa che i due DataFrame non sono uguali.
Possiamo quindi utilizzare la seguente sintassi per trovare quali righe esistono nel secondo DataFrame ma non nel primo:
#perform outer join on two DataFrames all_df = df1. merge (df2, indicator= True , how=' outer ') #find which rows only exist in second DataFrame only_df2 = all_df[all_df[' _merge '] == ' right_only '] only_df2 = only_df2. drop (' _merge ', axis= 1 ) #view results print (only_df2) team points 5 F 15 6 G 19 7:10 a.m.
Dal risultato, possiamo vedere che ci sono tre righe nel secondo DataFrame che non esistono nel primo DataFrame.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Panda: aggiungi una colonna da un DataFrame a un altro
Panda: ottieni righe che non si trovano in un altro DataFrame
Panda: come verificare se più colonne sono uguali