如何在 r 中使用 replicate() 函数(附示例)


您可以使用replicate()函数重复计算R中的表达式一定次数。

该函数使用以下基本语法:

复制 (n, expr)

金子:

  • n :重复计算表达式的次数。
  • expr :要计算的表达式。

以下示例展示了如何在实践中使用此功能。

示例 1:多次复制一个值

以下代码演示了如何使用replicate()函数多次重复计算单个值:

 #replicate the value 3 exactly 10 times
replicate(n= 10,3 )

[1] 3 3 3 3 3 3 3 3 3 3

#replicate the letter 'A' exactly 7 times
replicate(n= 7 , ' A ')

[1] “A” “A” “A” “A” “A” “A” “A”

#replicate FALSE exactly 5 times
replicate(n= 5 , FALSE )

[1] FALSE FALSE FALSE FALSE FALSE

示例 2:多次复制函数

现在假设我们要重复评估一个函数。

例如,假设我们使用rnorm()函数为随机变量生成三个值,该随机变量遵循均值为 0、标准差为 1 的正态分布:

 #make this example reproducible
set. seeds (1)

#generate 3 values that follow normal distribution
rnorm(3, mean= 0 , sd= 1 ) 

[1] -0.6264538 0.1836433 -0.8356286

通过使用replicate()函数,我们可以多次重复评估这个rnorm()函数。

例如,我们可以评估这个函数 5 次:

 #make this example reproducible
set. seeds (1)

#generate 3 values that follow normal distribution (replicate this 4 times)
replicate(n= 4 , rnorm(3, mean= 0 , sd= 1 ))

           [,1] [,2] [,3] [,4]
[1,] 1.5952808 0.4874291 -0.3053884 -0.6212406
[2,] 0.3295078 0.7383247 1.5117812 -2.2146999
[3,] -0.8204684 0.5757814 0.3898432 1.1249309

结果是一个 3 行 4 列的矩阵。

或者也许我们想评估这个函数 6 次:

 #make this example reproducible
set. seeds (1)

#generate 3 values that follow normal distribution (replicate this 6 times)
replicate(n= 6 , rnorm(3, mean= 0 , sd= 1 ))

           [,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1.5952808 0.4874291 -0.3053884 -0.6212406 -0.04493361 0.8212212
[2,] 0.3295078 0.7383247 1.5117812 -2.2146999 -0.01619026 0.5939013
[3,] -0.8204684 0.5757814 0.3898432 1.1249309 0.94383621 0.9189774

结果是 6 行 3 列的矩阵。

使用replicate()来模拟数据

replicate()函数对于运行模拟特别有用。

例如,假设我们想要生成 5 个大小为 n = 10 的样本,每个样本都遵循正态分布。

我们可以使用replicate()函数生成5个不同的样本,然后使用colMeans()函数找到每个样本的平均值:

 #make this example reproducible
set. seeds (1)

#create 5 samples each of size n=10
data <- replicate(n=5, rnorm(10, mean= 0 , sd= 1 ))

#view samples
data

            [,1] [,2] [,3] [,4] [,5]
 [1,] -0.6264538 1.51178117 0.91897737 1.35867955 -0.1645236
 [2,] 0.1836433 0.38984324 0.78213630 -0.10278773 -0.2533617
 [3,] -0.8356286 -0.62124058 0.07456498 0.38767161 0.6969634
 [4,] 1.5952808 -2.21469989 -1.98935170 -0.05380504 0.5566632
 [5,] 0.3295078 1.12493092 0.61982575 -1.37705956 -0.6887557
 [6,] -0.8204684 -0.04493361 -0.05612874 -0.41499456 -0.7074952
 [7,] 0.4874291 -0.01619026 -0.15579551 -0.39428995 0.3645820
 [8,] 0.7383247 0.94383621 -1.47075238 -0.05931340 0.7685329
 [9,] 0.5757814 0.82122120 -0.47815006 1.10002537 -0.1123462
[10,] -0.3053884 0.59390132 0.41794156 0.76317575 0.8811077

#calculate mean of each sample
colMeans(data)

[1] 0.1322028 0.2488450 -0.1336732 0.1207302 0.1341367

从结果我们可以看出:

  • 第一个样本的平均值是0.1322
  • 第二个样本的平均值是0.2488
  • 第三个样本的平均值是-0.1337

等等。

其他资源

如何在 R 中选择特定列
如何从R中的数据框中删除列
如何根据R中的条件从数据框中删除行

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注