Cara menggunakan fungsi split() di r untuk membagi data
Fungsi split() di R dapat digunakan untuk membagi data menjadi beberapa kelompok berdasarkan tingkat faktor.
Fungsi ini menggunakan sintaks dasar berikut:
membagi(x, f, …)
Emas:
- x : Nama vektor atau blok data yang akan dibagi menjadi beberapa kelompok
- f : Faktor yang menentukan pengelompokan
Contoh berikut menunjukkan cara menggunakan fungsi ini untuk membagi vektor dan bingkai data menjadi beberapa kelompok.
Contoh 1: Gunakan split() untuk membagi vektor menjadi beberapa kelompok
Kode berikut menunjukkan cara membagi vektor nilai data ke dalam kelompok berdasarkan vektor tingkat faktor:
#create vector of data values data <- c(1, 2, 3, 4, 5, 6) #create vector of groupings groups <- c('A', 'B', 'B', 'B', 'C', 'C') #split vector of data values into groups split(x = data, f = groups) $A [1] 1 $B [1] 2 3 4 $C [1] 5 6
Hasilnya adalah tiga kelompok.
Perhatikan bahwa Anda juga dapat menggunakan pengindeksan untuk mengambil grup tertentu:
#split vector of data values into groups and only display second group
split(x = data, f = groups)[2]
$B
[1] 2 3 4
Contoh 2: Gunakan split() untuk membagi bingkai data menjadi beberapa kelompok
Misalkan kita memiliki bingkai data berikut di R:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'G', 'F', 'F'), points=c(33, 28, 31, 39, 34, 44), assists=c(30, 28, 24, 24, 28, 19)) #view data frame df team position points assists 1 GA 33 30 2 AG 28 28 3 AF 31 24 4 BG 39 24 5 BF 34 28 6 BF 44 19
Kita dapat menggunakan kode berikut untuk membagi bingkai data menjadi beberapa kelompok berdasarkan variabel “tim”:
#split data frame into groups based on 'team'
split(df, f = df$team)
$A
team position points assists
1 GA 33 30
2 AG 28 28
3 AF 31 24
$B
team position points assists
4 BG 39 24
5 BF 34 28
6 BF 44 19
Hasilnya adalah dua kelompok. Yang pertama hanya berisi baris di mana “tim” sama dengan A dan yang kedua hanya berisi baris di mana “tim” sama dengan B.
Perhatikan bahwa kita juga dapat membagi data menjadi beberapa kelompok menggunakan beberapa variabel faktor. Misalnya, kode berikut menunjukkan cara membagi data ke dalam kelompok berdasarkan variabel “tim” dan “posisi”:
#split data frame into groups based on 'team' and 'position' variables
split(df, f = list(df$team, df$position))
$AF
team position points assists
3 AF 31 24
$BF
team position points assists
5 BF 34 28
6 BF 44 19
$AG
team position points assists
1 GA 33 30
2 AG 28 28
$BG
team position points assists
4 BG 39 24
Hasilnya adalah empat kelompok.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di R:
Cara menggunakan fungsi ringkasan() di R
Cara menggunakan fungsi replika() di R
Cara menggunakan fungsi match() di R