Panda si uniscono o si uniscono: qual è la differenza?
Le funzioni join() e merge() possono essere utilizzate per combinare due DataFrames panda.
Ecco la differenza principale tra le due funzioni:
- La funzione join() combina due DataFrame per indice.
- La funzione merge() combina due DataFrame in base alla colonna specificata.
Queste funzioni utilizzano la seguente sintassi di base:
#use join() to combine two DataFrames by index df1. join (df2) #use merge() to combine two DataFrames by specific column name df1. merge (df2,on=' column_name ')
Nei casi in cui sai di voler unire due DataFrame per indice, la funzione join() può essere utilizzata per salvare la digitazione.
Gli esempi seguenti mostrano come utilizzare nella pratica ciascuna funzione.
Esempio 1: come utilizzare la funzione join()
Il codice seguente mostra come utilizzare la funzione join() per combinare due DataFrame:
import pandas as pd #create two DataFrames df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ') df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ') #view two DataFrames print (df1); print (df2) steal points name name A 8 A 4 B 12 B 5 C 19 C 2 #use join() function to join together two DataFrames df1. join (df2) steal points name At 8 4 B 12 5 C 19 2
Per impostazione predefinita, la funzione join() ha unito i due DataFrame utilizzando la colonna indice.
Esempio 2: come utilizzare la funzione merge()
Il codice seguente mostra come utilizzare la funzione merge() per combinare due DataFrame:
import pandas as pd #create two DataFrames df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ') df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ') #view two DataFrames print (df1); print (df2) steal points name name A 8 A 4 B 12 B 5 C 19 C 2 #use join() function to join together two DataFrames df1. merge (df2, on=' name ') steal points name At 8 4 B 12 5 C 19 2
Tieni presente che la funzione merge() ha restituito esattamente lo stesso risultato, ma abbiamo dovuto dire esplicitamente ai panda di unirsi ai DataFrames utilizzando la colonna “name”.
Risorse addizionali
Puoi trovare la documentazione online completa per le funzioni join() e merge() qui:
Documentazione per la funzione join()
Documentazione per la funzione merge()
I seguenti tutorial spiegano come eseguire altre funzioni comuni nei panda:
Come aggiungere righe a un DataFrame Pandas
Come aggiungere una riga di intestazione a Pandas DataFrame
Come ottenere la prima riga di Pandas DataFrame
Come ottenere la prima colonna da Pandas DataFrame