Pandy dołącz lub połącz: jaka jest różnica?
Funkcje Join() i merge() mogą służyć do łączenia dwóch ramek DataFrame pand.
Oto główna różnica między tymi dwiema funkcjami:
- Funkcja Join() łączy dwie ramki danych według indeksu.
- Funkcja merge() łączy dwie ramki danych w oparciu o określoną kolumnę.
Funkcje te wykorzystują następującą podstawową składnię:
#use join() to combine two DataFrames by index df1. join (df2) #use merge() to combine two DataFrames by specific column name df1. merge (df2,on=' column_name ')
W przypadkach, gdy wiesz, że chcesz połączyć dwie ramki danych według indeksu, można użyć funkcji Join() , aby zaoszczędzić na pisaniu.
Poniższe przykłady pokazują, jak wykorzystać każdą funkcję w praktyce.
Przykład 1: Jak używać funkcji Join().
Poniższy kod pokazuje, jak używać funkcji Join() do łączenia dwóch ramek DataFrame:
import pandas as pd #create two DataFrames df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ') df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ') #view two DataFrames print (df1); print (df2) steal points name name A 8 A 4 B 12 B 5 C 19 C 2 #use join() function to join together two DataFrames df1. join (df2) steal points name At 8 4 B 12 5 C 19 2
Domyślnie funkcja Join() łączy dwie ramki danych przy użyciu kolumny indeksu.
Przykład 2: Jak używać funkcji merge().
Poniższy kod pokazuje, jak używać funkcji merge() do łączenia dwóch ramek danych:
import pandas as pd #create two DataFrames df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ') df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ') #view two DataFrames print (df1); print (df2) steal points name name A 8 A 4 B 12 B 5 C 19 C 2 #use join() function to join together two DataFrames df1. merge (df2, on=' name ') steal points name At 8 4 B 12 5 C 19 2
Zauważ, że funkcja merge() zwróciła dokładnie ten sam wynik, ale musieliśmy wyraźnie powiedzieć pandom, aby dołączyły do ramek DataFrames, używając kolumny „nazwa”.
Dodatkowe zasoby
Pełną dokumentację online funkcji Join() i merge() można znaleźć tutaj:
Dokumentacja funkcji Join().
Dokumentacja funkcji merge().
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje w pandach:
Jak dodać wiersze do ramki danych Pandas
Jak dodać wiersz nagłówka do Pandas DataFrame
Jak zdobyć pierwszy wiersz Pandas DataFrame
Jak zdobyć pierwszą kolumnę z Pandas DataFrame