Cara menggunakan fungsi gather di r (dengan contoh)
Fungsi Gather() dari paket Tidyr dapat digunakan untuk “mengumpulkan” pasangan nilai kunci di beberapa kolom.
Fungsi ini menggunakan sintaks dasar berikut:
kumpulkan (data, nilai kunci, dll.)
Emas:
- data : Nama bingkai data
- key : Nama kolom kunci yang akan dibuat
- value : Nama kolom nilai yang akan dibuat
- … : Tentukan kolom asal pengumpulan
Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.
Contoh 1: Kumpulkan nilai dari dua kolom
Misalkan kita memiliki bingkai data berikut di R:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12)) #view data frame df player year1 year2 1 to 12 22 2 B 15 29 3 C 19 18 4 D 19 12
Kita dapat menggunakan fungsi berkumpul() untuk membuat dua kolom baru bernama “tahun” dan “poin” sebagai berikut:
library (tidyr) #gather data from columns 2 and 3 gather(df, key=" year ", value=" points ", 2:3) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12
Contoh 2: Kumpulkan nilai dari lebih dari dua kolom
Misalkan kita memiliki bingkai data berikut di R:
#create data frame df2 <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12), year3=c(17, 17, 22, 25)) #view data frame df2 player year1 year2 year3 1 A 12 22 17 2 B 15 29 17 3 C 19 18 22 4 D 19 12 25
Kita dapat menggunakan fungsi kumpulkan() untuk “mengumpulkan” nilai dari kolom 2, 3, dan 4 menjadi dua kolom baru yang disebut “tahun” dan “poin” sebagai berikut:
library (tidyr) #gather data from columns 2, 3, and 4 gather(df, key=" year ", value=" points ", 2:4) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12 9 A year3 17 10 B year3 17 11 C year3 22 12 D year3 25
Sumber daya tambahan
Tujuan dari paket Tidyr adalah untuk membuat data yang “rapi”, yang memiliki ciri-ciri sebagai berikut:
- Setiap kolom adalah variabel.
- Setiap baris adalah observasi.
- Setiap sel adalah nilai unik.
Paket Tidyr menggunakan empat fungsi utama untuk membuat data terurut:
1. Fungsi penyebaran() .
2. Fungsi kumpulkan() .
3. Fungsi terpisah() .
4. Fungsi satuan() .
Jika Anda menguasai keempat fungsi ini, Anda akan dapat membuat data yang “rapi” dari bingkai data mana pun.