Cara menggunakan fungsi spread di r (dengan contoh)


Fungsi spread() dalam paket Tidyr dapat digunakan untuk “menyebarkan” pasangan nilai kunci ke beberapa kolom.

Fungsi ini menggunakan sintaks dasar berikut:

penyebaran (data, nilai kunci)

Emas:

  • data : Nama bingkai data
  • key : Kolom yang nilainya akan menjadi nama variabel
  • value : Kolom dimana nilai akan diisi di bawah variabel baru yang dibuat dari kunci

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh 1: Sebarkan nilai ke dalam dua kolom

Misalkan kita memiliki bingkai data berikut di R:

 #create data frame
df <- data. frame (player= rep (c(' A ', ' B '), each= 4 ),
                 year= rep (c(1, 1, 2, 2), times= 2 ),
                 stat= rep (c(' points ', ' assists '), times= 4 ),
                 amount=c(14, 6, 18, 7, 22, 9, 38, 4))

#view data frame
df

  player year stat amount
1 A 1 points 14
2 A 1 assists 6
3 A 2 points 18
4 A 2 assists 7
5 B 1 points 22
6 B 1 assists 9
7 B 2 points 38
8 B 2 assists 4

Kita dapat menggunakan fungsi spread() untuk mengubah nilai kolom stat menjadi kolomnya sendiri:

 library (tidyr)

#spread stat column across multiple columns
spread(df, key=stat, value=amount)

  player year assists points
1 to 1 6 14
2 to 2 7 18
3 B 1 9 22
4 B 2 4 38

Contoh 2: Sebarkan nilai ke lebih dari dua kolom

Misalkan kita memiliki bingkai data berikut di R:

 #create data frame
df2 <- data. frame (player= rep (c(' A '), times= 8 ),
                 year= rep (c(1, 2), each= 4 ),
                 stat= rep (c(' points ', ' assists ', ' steals ', ' blocks '), times= 2 ),
                 amount=c(14, 6, 2, 1, 29, 9, 3, 4))

#view data frame
df2

  player year stat amount
1 A 1 points 14
2 A 1 assists 6
3 A 1 steals 2
4 A 1 blocks 1
5 A 2 points 29
6 A 2 assists 9
7 A 2 steals 3
8 A 2 blocks 4

Kita dapat menggunakan fungsi spread() untuk mengubah empat nilai unik di kolom stat menjadi empat kolom baru:

 library (tidyr)

#spread stat column across multiple columns
spread(df2, key=stat, value=amount)

  player year assists blocks points steals
1 A 1 6 1 14 2
2 A 2 9 4 29 3

Sumber daya tambahan

Tujuan dari paket Tidyr adalah untuk membuat data yang “rapi”, yang memiliki ciri-ciri sebagai berikut:

  • Setiap kolom adalah variabel.
  • Setiap baris adalah observasi.
  • Setiap sel adalah nilai unik.

Paket Tidyr menggunakan empat fungsi utama untuk membuat data terurut:

1. Fungsi penyebaran() .

2. Fungsi kumpulkan() .

3. Fungsi terpisah() .

4. Fungsi satuan() .

Jika Anda menguasai keempat fungsi ini, Anda akan dapat membuat data yang “rapi” dari bingkai data mana pun.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *