Panda: come verificare se due dataframe sono uguali


È possibile utilizzare la seguente sintassi di base per verificare se due DataFrames panda sono uguali:

 df1. equals (df2)

Ciò restituirà un valore True o False .

Se due DataFrame non sono uguali, puoi utilizzare la seguente sintassi per trovare le righe nel secondo DataFrame che non esistono nel primo DataFrame:

 #perform outer join on two DataFrames
all_df = df1. merge (df2, indicator= True , how=' outer ')

#find which rows only exist in second DataFrame
only_df2 = all_df[all_df[' _merge '] == ' right_only ']
only_df2 = only_df2. drop (' _merge ', axis= 1 )

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: controlla se due DataFrames panda sono uguali

Supponiamo di avere i seguenti due DataFrames panda:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], 
                    ' points ': [12, 15, 22, 29, 24]}) 

print (df1)

  team points
0 to 12
1 B 15
2 C 22
3 D 29
4 E 24

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'D', 'F', 'G', 'H'],
                    ' points ': [12, 29, 15, 19, 10]})

print (df2)

  team points
0 to 12
1 D 29
2 F 15
3 G 19
4:10 a.m.

Possiamo usare la seguente sintassi per verificare se i due DataFrame sono uguali:

 #check if two DataFrames are equal
df1. equals (df2)

False

L’output restituisce False , il che significa che i due DataFrame non sono uguali.

Possiamo quindi utilizzare la seguente sintassi per trovare quali righe esistono nel secondo DataFrame ma non nel primo:

 #perform outer join on two DataFrames
all_df = df1. merge (df2, indicator= True , how=' outer ')

#find which rows only exist in second DataFrame
only_df2 = all_df[all_df[' _merge '] == ' right_only ']
only_df2 = only_df2. drop (' _merge ', axis= 1 )

#view results
print (only_df2)

  team points
5 F 15
6 G 19
7:10 a.m.

Dal risultato, possiamo vedere che ci sono tre righe nel secondo DataFrame che non esistono nel primo DataFrame.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Panda: aggiungi una colonna da un DataFrame a un altro
Panda: ottieni righe che non si trovano in un altro DataFrame
Panda: come verificare se più colonne sono uguali

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *