Cara menggunakan fungsi split() di r untuk membagi data


Fungsi split() di R dapat digunakan untuk membagi data menjadi beberapa kelompok berdasarkan tingkat faktor.

Fungsi ini menggunakan sintaks dasar berikut:

membagi(x, f, …)

Emas:

  • x : Nama vektor atau blok data yang akan dibagi menjadi beberapa kelompok
  • f : Faktor yang menentukan pengelompokan

Contoh berikut menunjukkan cara menggunakan fungsi ini untuk membagi vektor dan bingkai data menjadi beberapa kelompok.

Contoh 1: Gunakan split() untuk membagi vektor menjadi beberapa kelompok

Kode berikut menunjukkan cara membagi vektor nilai data ke dalam kelompok berdasarkan vektor tingkat faktor:

 #create vector of data values
data <- c(1, 2, 3, 4, 5, 6)

#create vector of groupings
groups <- c('A', 'B', 'B', 'B', 'C', 'C')

#split vector of data values into groups
split(x = data, f = groups)

$A
[1] 1

$B
[1] 2 3 4

$C
[1] 5 6

Hasilnya adalah tiga kelompok.

Perhatikan bahwa Anda juga dapat menggunakan pengindeksan untuk mengambil grup tertentu:

 #split vector of data values into groups and only display second group
split(x = data, f = groups)[2]

$B
[1] 2 3 4

Contoh 2: Gunakan split() untuk membagi bingkai data menjadi beberapa kelompok

Misalkan kita memiliki bingkai data berikut di R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'G', 'F', 'F'),
                 points=c(33, 28, 31, 39, 34, 44),
                 assists=c(30, 28, 24, 24, 28, 19))

#view data frame
df

  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
4 BG 39 24
5 BF 34 28
6 BF 44 19

Kita dapat menggunakan kode berikut untuk membagi bingkai data menjadi beberapa kelompok berdasarkan variabel “tim”:

 #split data frame into groups based on 'team'
split(df, f = df$team)

$A
  team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24

$B
  team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19

Hasilnya adalah dua kelompok. Yang pertama hanya berisi baris di mana “tim” sama dengan A dan yang kedua hanya berisi baris di mana “tim” sama dengan B.

Perhatikan bahwa kita juga dapat membagi data menjadi beberapa kelompok menggunakan beberapa variabel faktor. Misalnya, kode berikut menunjukkan cara membagi data ke dalam kelompok berdasarkan variabel “tim” dan “posisi”:

 #split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))

$AF
  team position points assists
3 AF 31 24

$BF
  team position points assists
5 BF 34 28
6 BF 44 19

$AG
  team position points assists
1 GA 33 30
2 AG 28 28

$BG
  team position points assists
4 BG 39 24

Hasilnya adalah empat kelompok.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di R:

Cara menggunakan fungsi ringkasan() di R
Cara menggunakan fungsi replika() di R
Cara menggunakan fungsi match() di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *