Cara menggabungkan dua pandas dataframes (dengan contoh)
Anda dapat menggunakan sintaks dasar berikut untuk menggabungkan dua panda DataFrames:
df3 = pd. concat ([df1, df2], ignore_index= True )
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Cara menggabungkan dua Pandas DataFrames
Mari kita asumsikan kita memiliki dua panda DataFrames berikut:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A'], ' assists ': [5, 7, 7, 9], ' points ': [11, 8, 10, 6]}) df2 = pd. DataFrame ({' team ': ['B', 'B', 'B', 'B'], ' assists ': [4, 4, 3, 7], ' points ': [14, 11, 7, 6]}) #view DataFrames print (df1) team assists points 0 to 5 11 1 to 7 8 2 to 7 10 3 to 9 6 print (df2) team assists points 0 B 4 14 1 B 4 11 2 B 3 7 3 B 7 6
Kita dapat menggunakan sintaks berikut untuk menggabungkan dua DataFrame:
#concatenate the DataFrames
df3 = pd. concat ([df1, df2])
#view resulting DataFrame
print (df3)
team assists points
0 to 5 11
1 to 7 8
2 to 7 10
3 to 9 6
0 B 4 14
1 B 4 11
2 B 3 7
3 B 7 6
Hasilnya adalah DataFrame yang berisi data dari kedua DataFrame.
Jika Anda ingin membuat indeks baru saat menggabungkan DataFrames, Anda harus menggunakan argumen abaikan_index :
#concatenate the DataFrames and ignore index
df3 = pd. concat ([df1, df2], ignore_index= True )
#view resulting DataFrame
print (df3)
team assists points
0 to 5 11
1 to 7 8
2 to 7 10
3 to 9 6
4 B 4 14
5 B 4 11
6 B 3 7
7 B 7 6
Perhatikan bahwa indeks DataFrame yang dihasilkan adalah antara 0 dan 7.
Catatan #1: Dalam contoh ini, kami telah menggabungkan dua DataFrame panda, tetapi Anda dapat menggunakan sintaksis persis ini untuk menggabungkan sejumlah DataFrame yang Anda inginkan.
Catatan #2: Anda dapat menemukan dokumentasi lengkap untuk fungsi pandas concat() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:
Cara menggabungkan Pandas DataFrames di beberapa kolom
Cara menggabungkan dua Pandas DataFrames di index
Bagaimana cara menambahkan kolom ke Pandas DataFrame