Cara menggunakan rbind dengan python (setara dengan r)


Fungsi rbind di R, kependekan dari row-bind , dapat digunakan untuk menggabungkan frame data berdasarkan barisnya.

Kita dapat menggunakan fungsi pandas concat() untuk melakukan fungsi yang setara dengan Python:

 df3 = pd. concat ([df1, df2])

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh 1: Gunakan rbind dengan Python dengan kolom yang sama

Mari kita asumsikan kita memiliki dua panda DataFrames berikut:

 import pandas as pd

#define DataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                    ' points ': [99, 91, 104, 88, 108]})

print (df1)

  team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108

df2 = pd. DataFrame ({' assists ': ['F', 'G', 'H', 'I', 'J'],
                    ' rebounds ': [91, 88, 85, 87, 95]})

print (df2)

  team points
0 F 91
1 G 88
2:85
3 I 87
4 days 95

Kita dapat menggunakan fungsi concat() untuk menghubungkan kedua DataFrame ini dengan cepat berdasarkan barisnya:

 #row-bind two DataFrames
df3 = pd. concat ([df1, df2])

#view resulting DataFrame
df3

	team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
0 F 91
1 G 88
2:85
3 I 87
4 days 95

Perhatikan bahwa kita juga dapat menggunakan reset_index() untuk menyetel ulang nilai indeks DataFrame baru:

 #row-bind two DataFrames and reset index values
df3 = pd. concat ([df1, df2]). reset_index (drop= True )

#view resulting DataFrame
df3

	team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
5 F 91
6 G 88
7:85 a.m.
8 I 87
9 D 95

Contoh 2: Menggunakan rbind dengan Python dengan Kolom Tidak Sama

Kita juga dapat menggunakan fungsi concat() untuk menghubungkan dua DataFrame yang memiliki jumlah kolom yang tidak sama dan nilai yang hilang hanya akan diisi dengan NaN:

 import pandas as pd

#define DataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                    ' points ': [99, 91, 104, 88, 108]})

df2 = pd. DataFrame ({' team ': ['F', 'G', 'H', 'I', 'J'],
                    ' points ': [91, 88, 85, 87, 95],
                    ' rebounds ': [24, 27, 27, 30, 35]})

#row-bind two DataFrames
df3 = pd. concat ([df1, df2]). reset_index (drop= True )

#view resulting DataFrame
df3

	team points rebounds
0 to 99 NaN
1 B 91 NaN
2 C 104 NaN
3 D 88 NaN
4 E 108 NaN
5 F 91 24.0
6G 88 27.0
7:85 AM 27.0
8 I 87 30.0
9 D 95 35.0

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan fungsi umum lainnya dengan Python:

Cara menggunakan cbind dengan Python (setara dengan R)
Bagaimana melakukan VLOOKUP di Pandas
Cara menghapus baris yang berisi nilai tertentu di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *