Cara melakukan outer join di pandas (dengan contoh)
Gabungan luar adalah jenis gabungan yang mengembalikan semua baris dari dua panda DataFrames.
Anda dapat menggunakan sintaks dasar berikut untuk melakukan gabungan luar di panda:
import pandas as pd df1. merge (df2, on=' some_column ', how=' outer ')
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Cara melakukan penggabungan luar di Pandas
Katakanlah kita memiliki dua panda DataFrames berikut yang berisi informasi tentang berbagai tim bola basket:
import pandas as pd #createDataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28]}) df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'J', 'K'], ' assists ': [4, 9, 14, 13, 10, 8]}) #view DataFrames print (df1) team points 0 to 18 1 B 22 2 C 19 3 D 14 4 E 14 5 F 11 6 G 20 7:28 a.m. print (df2) team assists 0 to 4 1 B 9 2 C 14 3 D 13 4 D 10 5K 8
Kita dapat menggunakan kode berikut untuk melakukan gabungan luar, mencocokkan baris antara DataFrames berdasarkan nilai kolom tim dan mempertahankan semua baris dari kedua DataFrames:
#perform outer join
df1. merge (df2, on=' team ', how=' outer ')
team points assists
0 to 18.0 4.0
1 B 22.0 9.0
2 C 19.0 14.0
3D 14.0 13.0
4 E 14.0 NaN
5 F 11.0 NaN
6G 20.0 NaN
7 H 28.0 NaN
8 J NaN 10.0
9K NaN 8.0
Hasilnya adalah DataFrame yang berisi semua baris di setiap DataFrame.
Perhatikan bahwa nilai NaN diisi untuk setiap baris di mana nilai kolom tim tidak ada di kedua DataFrames.
Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi penggabungan di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:
Cara melakukan anti-gabung di Pandas
Cara melakukan inner join di Pandas
Cara melakukan cross join di Pandas