Panda si uniscono o si uniscono: qual è la differenza?


Le funzioni join() e merge() possono essere utilizzate per combinare due DataFrames panda.

Ecco la differenza principale tra le due funzioni:

  • La funzione join() combina due DataFrame per indice.
  • La funzione merge() combina due DataFrame in base alla colonna specificata.

Queste funzioni utilizzano la seguente sintassi di base:

 #use join() to combine two DataFrames by index
df1. join (df2)

#use merge() to combine two DataFrames by specific column name
df1. merge (df2,on=' column_name ')

Nei casi in cui sai di voler unire due DataFrame per indice, la funzione join() può essere utilizzata per salvare la digitazione.

Gli esempi seguenti mostrano come utilizzare nella pratica ciascuna funzione.

Esempio 1: come utilizzare la funzione join()

Il codice seguente mostra come utilizzare la funzione join() per combinare due DataFrame:

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. join (df2)

	steal points
name		
At 8 4
B 12 5
C 19 2

Per impostazione predefinita, la funzione join() ha unito i due DataFrame utilizzando la colonna indice.

Esempio 2: come utilizzare la funzione merge()

Il codice seguente mostra come utilizzare la funzione merge() per combinare due DataFrame:

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. merge (df2, on=' name ')

	steal points
name		
At 8 4
B 12 5
C 19 2

Tieni presente che la funzione merge() ha restituito esattamente lo stesso risultato, ma abbiamo dovuto dire esplicitamente ai panda di unirsi ai DataFrames utilizzando la colonna “name”.

Risorse addizionali

Puoi trovare la documentazione online completa per le funzioni join() e merge() qui:

Documentazione per la funzione join()
Documentazione per la funzione merge()

I seguenti tutorial spiegano come eseguire altre funzioni comuni nei panda:

Come aggiungere righe a un DataFrame Pandas
Come aggiungere una riga di intestazione a Pandas DataFrame
Come ottenere la prima riga di Pandas DataFrame
Come ottenere la prima colonna da Pandas DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *