Panda: come confrontare colonne in due dataframes diversi


È possibile utilizzare i seguenti metodi per confrontare colonne di due diversi DataFrames panda:

Metodo 1: conta i valori corrispondenti tra le colonne

 df1[' my_column ']. isin (df2[' my_column ']). value_counts ()

Metodo 2: mostra i valori corrispondenti tra le colonne

 p.d. merge (df1, df2, on=[' my_column '], how=' inner ')

Gli esempi seguenti mostrano come utilizzare ciascun metodo con i seguenti DataFrames panda:

 import numpy as np
import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['Mavs', 'Rockets', 'Spurs', 'Heat', 'Nets'],
                    ' points ': [22, 30, 15, 17, 14]})

#view DataFrame
print (df1)

      team points
0 Mavs 22
1 Rockets 30
2 Spurs 15
3 Heat 17
4 Nets 14

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['Mavs', 'Thunder', 'Spurs', 'Nets', 'Cavs'],
                    ' points ': [25, 40, 31, 32, 22]})

#view DataFrame
print (df2)

      team points
0 Mavs 25
1 Thunder 40
2 Spurs 31
3 Nets 32
4 Cavs 22

Esempio 1: contare i valori corrispondenti tra le colonne

Il codice seguente mostra come contare il numero di valori corrispondenti tra le colonne del team in ciascun DataFrame:

 #count matching values in team columns
df1[' team ']. isin (df2[' team ']). value_counts ()

True 3
False 2
Name: team, dtype: int64

Vediamo che i due DataFrame hanno 3 nomi di squadra in comune e 2 nomi di squadra diversi.

Esempio 2: mostra i valori corrispondenti tra le colonne

Il codice seguente mostra come visualizzare i valori di corrispondenza effettivi tra le colonne del team in ciascun DataFrame:

 #display matching values between team columns
p.d. merge (df1, df2, on=[' team '], how=' inner ')

	team points_x points_y
0 Mavs 22 25
1 Spurs 15 31
2 Nets 14 32

Dal risultato possiamo vedere che entrambi i DataFrames hanno in comune i seguenti valori nelle colonne del team :

  • Mav
  • Speroni
  • Reti

Correlati: Come eseguire un inner join in Panda (con esempio)

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come rinominare le colonne in Pandas
Come aggiungere una colonna a un DataFrame Pandas
Come modificare l’ordine delle colonne in Pandas DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *