如何使用 dplyr 在 r 中选择随机行


您可以使用dplyr包中的函数使用以下方法在 R 数据框中选择随机行:

方法 1:选择随机行数

 df %>% sample_n( 5 )

此函数从数据框中随机选择5行。

方法 2:选择随机部分行

 df %>% sample_frac( .25 )

此函数随机选择数据框中所有行的25%

以下示例展示了如何在 R 中使用以下数据框实际使用每种方法:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
                 rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7

示例 1:选择随机数量的行

我们可以使用以下代码从数据框中随机选择5行:

 library (dplyr)

#randomly select 5 rows from data frame
df %>% sample_n( 5 )

  team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8

请注意,从数据框中随机选择五行。

示例 2:选择行的随机部分

我们可以使用以下代码随机选择数据框中所有行的25%

 library (dplyr)

#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )

  team points rebounds
1 E 15 10
2 G 12 7

由于原始数据框有 8 个总计值,因此 8 的 25% 等于 2。

因此,从数据帧中随机选择两行。

注意:您可以在此处找到 dplyr 中的sample_nsample_frac函数的完整文档。

其他资源

以下教程解释了如何在 dplyr 中执行其他常见操作:

如何使用 dplyr 按索引选择列
如何使用 dplyr 按组选择第一行
如何使用 dplyr 按多个条件进行过滤
如何使用 dplyr 过滤包含特定字符串的行

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注