Panda: come unire due dataframe con nomi di colonne diversi
È possibile utilizzare la seguente sintassi di base per unire due DataFrames Panda con nomi di colonna diversi:
p.d. merge (df1, df2, left_on=' left_column_name ', right_on=' right_column_name ')
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: unisci due DataFrames Pandas con nomi di colonna diversi
Supponiamo di avere i seguenti due DataFrames panda:
import pandas as pd #create first DataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [4, 4, 6, 8, 9, 5]}) #view DataFrame print (df1) team points 0 to 4 1 B 4 2 C 6 3 D 8 4 E 9 5 F 5 #create second DataFrame df2 = pd. DataFrame ({' team_name ': ['A', 'B', 'C', 'D', 'E', 'F'], ' rebounds ': [12, 7, 8, 8, 5, 11]}) #view DataFrame print (df2) team_name rebounds 0 to 12 1 B 7 2 C 8 3 D 8 4 E 5 5 F 11
Possiamo utilizzare la seguente sintassi per eseguire un inner join, utilizzando la colonna team nel primo DataFrame e la colonna team_name nel secondo DataFrame:
#merge DataFrames
df3 = pd. merge (df1, df2, left_on=' team ', right_on=' team_name ')
#view result
print (df3)
team points team_name rebounds
0 A 4 A 12
1 B 4 B 7
2 C 6 C 8
3 D 8 D 8
4 E 9 E 5
5 F 5 F 11
Tieni presente che siamo in grado di eseguire con successo un inner join anche se i due nomi di colonna utilizzati per il join erano diversi in ciascun DataFrame.
Tieni presente che possiamo anche utilizzare il seguente codice per rimuovere la colonna team_name dal DataFrame finale unito poiché i valori in questa colonna corrispondono a quelli nella colonna team :
#drop team_name column
df3. drop (' team_name ', axis= 1 , inplace= True )
#view updated DataFrame
print (df3)
team points rebounds
0 to 4 12
1 B 4 7
2 C 6 8
3 D 8 8
4 E 9 5
5 F 5 11
Tieni presente che la colonna team_name è stata rimossa dal DataFrame.
Correlato: Come eliminare colonne in Panda (4 esempi)
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni dei panda:
Come modificare l’ordine delle colonne in Pandas
Come rinominare le colonne in Pandas
Come ordinare le colonne per nome in Pandas