Pandy dołącz lub połącz: jaka jest różnica?


Funkcje Join() i merge() mogą służyć do łączenia dwóch ramek DataFrame pand.

Oto główna różnica między tymi dwiema funkcjami:

  • Funkcja Join() łączy dwie ramki danych według indeksu.
  • Funkcja merge() łączy dwie ramki danych w oparciu o określoną kolumnę.

Funkcje te wykorzystują następującą podstawową składnię:

 #use join() to combine two DataFrames by index
df1. join (df2)

#use merge() to combine two DataFrames by specific column name
df1. merge (df2,on=' column_name ')

W przypadkach, gdy wiesz, że chcesz połączyć dwie ramki danych według indeksu, można użyć funkcji Join() , aby zaoszczędzić na pisaniu.

Poniższe przykłady pokazują, jak wykorzystać każdą funkcję w praktyce.

Przykład 1: Jak używać funkcji Join().

Poniższy kod pokazuje, jak używać funkcji Join() do łączenia dwóch ramek DataFrame:

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. join (df2)

	steal points
name		
At 8 4
B 12 5
C 19 2

Domyślnie funkcja Join() łączy dwie ramki danych przy użyciu kolumny indeksu.

Przykład 2: Jak używać funkcji merge().

Poniższy kod pokazuje, jak używać funkcji merge() do łączenia dwóch ramek danych:

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. merge (df2, on=' name ')

	steal points
name		
At 8 4
B 12 5
C 19 2

Zauważ, że funkcja merge() zwróciła dokładnie ten sam wynik, ale musieliśmy wyraźnie powiedzieć pandom, aby dołączyły do ramek DataFrames, używając kolumny „nazwa”.

Dodatkowe zasoby

Pełną dokumentację online funkcji Join() i merge() można znaleźć tutaj:

Dokumentacja funkcji Join().
Dokumentacja funkcji merge().

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje w pandach:

Jak dodać wiersze do ramki danych Pandas
Jak dodać wiersz nagłówka do Pandas DataFrame
Jak zdobyć pierwszy wiersz Pandas DataFrame
Jak zdobyć pierwszą kolumnę z Pandas DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *