Cara menggabungkan pandas dataframes di beberapa kolom
Seringkali Anda mungkin ingin menggabungkan dua panda DataFrames di beberapa kolom. Untungnya, hal ini mudah dilakukan menggunakan fungsi pandas merge() , yang menggunakan sintaks berikut:
p.d. merge (df1, df2, left_on=['col1','col2'], right_on = ['col1','col2'])
Tutorial ini menjelaskan cara menggunakan fungsi ini dalam praktik.
Contoh 1: Gabungkan beberapa kolom dengan nama berbeda
Mari kita asumsikan kita memiliki dua panda DataFrames berikut:
import pandas as pd #create and view first DataFrame df1 = pd.DataFrame({'a1': [0, 0, 1, 1, 2], 'b': [0, 0, 1, 1, 1], 'c': [11, 8, 10, 6, 6]}) print (df1) a1 bc 0 0 0 11 1 0 0 8 2 1 1 10 3 1 1 6 4 2 1 6 #create and view second DataFrame df2 = pd.DataFrame({'a2': [0, 1, 1, 1, 3], 'b': [0, 0, 0, 1, 1], 'd': [22, 24, 25, 33, 37]}) print (df2) a2 comic 0 0 0 22 1 1 0 24 2 1 0 25 3 1 1 33 4 3 1 37
Kode berikut menunjukkan cara melakukan penggabungan kiri menggunakan beberapa kolom dari kedua DataFrames:
p.d. merge (df1, df2, how=' left ', left_on=[' a1 ', ' b '], right_on = [' a2 ', ' b ']) a1 b c a2 d 0 0 0 11 0.0 22.0 1 0 0 8 0.0 22.0 2 1 1 10 1.0 33.0 3 1 1 6 1.0 33.0 4 2 1 6 NaN NaN
Contoh 2: Gabungkan beberapa kolom dengan nama yang sama
Misalkan kita memiliki dua panda DataFrames berikut dengan nama kolom yang sama:
import pandas as pd #createDataFrames df1 = pd.DataFrame({'a': [0, 0, 1, 1, 2], 'b': [0, 0, 1, 1, 1], 'c': [11, 8, 10, 6, 6]}) df2 = pd.DataFrame({'a': [0, 1, 1, 1, 3], 'b': [0, 0, 0, 1, 1], 'd': [22, 24, 25, 33, 37]})
Dalam hal ini, kita dapat menyederhanakan penggunaan on = [‘a’, ‘b’] karena nama kolom di kedua DataFrame sama:
p.d. merge (df1, df2, how=' left ', on=[' a ', ' b ']) a b c d 0 0 0 11 22.0 1 0 0 8 22.0 2 1 1 10 33.0 3 1 1 6 33.0 4 2 1 6 NaN
Sumber daya tambahan
Cara menggabungkan dua Pandas DataFrames di index
Cara menumpuk beberapa Pandas DataFrames