Cara memilih garis acak di r menggunakan dplyr
Anda dapat menggunakan metode berikut untuk memilih baris acak dalam bingkai data di R menggunakan fungsi dalam paket dplyr :
Metode 1: Pilih sejumlah baris secara acak
df %>% sample_n( 5 )
Fungsi ini secara acak memilih 5 baris dari bingkai data.
Metode 2: pilih pecahan baris secara acak
df %>% sample_frac( .25 )
Fungsi ini secara acak memilih 25% dari seluruh baris dalam bingkai data.
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
Contoh 1: Pilih sejumlah baris secara acak
Kita dapat menggunakan kode berikut untuk memilih secara acak 5 baris dari bingkai data:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
Perhatikan bahwa lima baris dipilih secara acak dari bingkai data.
Contoh 2: pilih pecahan baris secara acak
Kita dapat menggunakan kode berikut untuk memilih secara acak 25% dari seluruh baris dalam bingkai data:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
Karena kerangka data asli memiliki 8 nilai total, 25% dari 8 sama dengan 2.
Jadi, dua baris dipilih secara acak dari bingkai data.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi sample_n dan sample_frac di dplyr di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di dplyr:
Cara memilih kolom berdasarkan indeks menggunakan dplyr
Cara memilih baris pertama berdasarkan grup menggunakan dplyr
Cara memfilter berdasarkan beberapa kondisi menggunakan dplyr
Cara memfilter baris yang berisi string tertentu menggunakan dplyr