如何计算 r 中的引导标准误差
Bootstrapping是一种可用于估计平均值标准误差的方法。
计算自举标准误差的基本过程如下:
- 从给定的数据集中取出k 个具有替换的重复样本。
- 对于每个样本,计算标准误差:s/√ n
- 这导致标准误差的k 个不同估计。要找到引导标准误差,请取k 个标准误差的平均值。
以下示例解释了可用于计算 R 中的引导标准误差的两种不同方法。
方法 1:使用入门包
在 R 中计算启动标准错误的一种方法是使用启动库中的boot()函数。
以下代码显示了如何计算 R 中给定数据集的引导标准误差:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function (x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics: original bias std. error t1* 21.5 0.254 2.379263
“原始”值21.5显示原始数据集的平均值。 “标准。值2.379263表示平均值的引导标准误差。
请注意,在此示例中,我们使用 100 个引导样本来估计均值的标准误差,但我们也可以使用 1,000 个或 10,000 个或我们想要的任意数量的引导样本。
方法二:自己写公式
计算引导标准误差的另一种方法是编写我们自己的函数。
以下代码展示了如何执行此操作:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x)))) [1] 2.497414
引导的标准错误结果是2.497414 。
请注意,此标准误差与前面示例中计算的标准误差非常相似。