如何计算 r 中的引导标准误差


Bootstrapping是一种可用于估计平均值标准误差的方法。

计算自举标准误差的基本过程如下:

  • 从给定的数据集中取出k 个具有替换的重复样本。
  • 对于每个样本,计算标准误差:s/√ n
  • 这导致标准误差的k 个不同估计。要找到引导标准误差,请取k 个标准误差的平均值。

以下示例解释了可用于计算 R 中的引导标准误差的两种不同方法。

方法 1:使用入门包

在 R 中计算启动标准错误的一种方法是使用启动库中的boot()函数。

以下代码显示了如何计算 R 中给定数据集的引导标准误差:

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics:
    original bias std. error
t1* 21.5 0.254 2.379263

“原始”值21.5显示原始数据集的平均值。 “标准。值2.379263表示平均值的引导标准误差。

请注意,在此示例中,我们使用 100 个引导样本来估计均值的标准误差,但我们也可以使用 1,000 个或 10,000 个或我们想要的任意数量的引导样本。

方法二:自己写公式

计算引导标准误差的另一种方法是编写我们自己的函数。

以下代码展示了如何执行此操作:

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

引导的标准错误结果是2.497414

请注意,此标准误差与前面示例中计算的标准误差非常相似。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注