Cara melakukan inner join di r (dengan contoh)


Ada dua cara umum untuk melakukan inner join di R:

Metode 1: Gunakan Basis R

 merge(df1, df2, by=' column_to_join_on ')

Metode 2: gunakan dplyr

 library (dplyr)

inner_join(df1, df2, by=' column_to_join_on ')

Kedua metode akan menghasilkan hasil yang sama, namun metode dplyr akan cenderung bekerja lebih cepat pada kumpulan data yang sangat besar.

Contoh berikut menunjukkan cara menggunakan masing-masing fungsi ini dalam praktik dengan bingkai data berikut:

 #define first data frame
df1 = data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

df1

  team points
1 to 18
2 B 22
3 C 19
4 D 14
5 E 14
6 F 11
7 G 20
8:28 a.m.

#define second data frame
df2 = data. frame (team=c('A', 'B', 'C', 'D', 'G', 'H'),
                 assists=c(4, 9, 14, 13, 10, 8))

df2

  team assists
1 to 4
2 B 9
3 C 14
4 D 13
5G 10
6:8 a.m.

Contoh 1: Gabungan dalam menggunakan Basis R

Kita dapat menggunakan fungsi merge() di basis R untuk melakukan penggabungan dalam, menggunakan kolom ‘tim’ sebagai kolom untuk bergabung:

 #perform inner join using base R
df3 <- merge(df1, df2, by=' team ')

#view result
df3

  team points assists
1 to 18 4
2 B 22 9
3 C 19 14
4 D 14 13
5 G 20 10
6:28 a.m. 8

Perhatikan bahwa hanya tim yang muncul di kedua kumpulan data yang dipertahankan di kumpulan data akhir.

Contoh 2: Gabungan dalam menggunakan dplyr

Kita dapat menggunakan fungsi inner_join() dari paket dplyr untuk melakukan inner join, menggunakan kolom ‘team’ sebagai kolom untuk bergabung:

 library (dplyr)

#perform inner join using dplyr 
df3 <- inner_join(df1, df2, by=' team ')

#view result
df3

  team points assists
1 to 18 4
2 B 22 9
3 C 19 14
4 D 14 13
5 G 20 10
6:28 a.m. 8

Perhatikan bahwa ini sesuai dengan hasil yang kita peroleh dengan menggunakan fungsi merge() di basis R.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di R:

Bagaimana cara melakukan gabung kiri di R
Bagaimana cara melakukan join yang benar di R
Bagaimana cara menambahkan kolom ke bingkai data di R
Cara menghapus kolom dari bingkai data di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *