如何计算 r 中的引导标准误差

经过本杰明·安德森博 7月 25, 2023 指导 0 条评论

Bootstrapping是一种可用于估计平均值标准误差的方法。

计算自举标准误差的基本过程如下：

从给定的数据集中取出k 个具有替换的重复样本。
对于每个样本，计算标准误差：s/√ n
这导致标准误差的k 个不同估计。要找到引导标准误差，请取k 个标准误差的平均值。

以下示例解释了可用于计算 R 中的引导标准误差的两种不同方法。

方法 1：使用入门包

在 R 中计算启动标准错误的一种方法是使用启动库中的boot()函数。

以下代码显示了如何计算 R 中给定数据集的引导标准误差：

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics:
    original bias std. error
t1* 21.5 0.254 2.379263

“原始”值21.5显示原始数据集的平均值。 “标准。值2.379263表示平均值的引导标准误差。

请注意，在此示例中，我们使用 100 个引导样本来估计均值的标准误差，但我们也可以使用 1,000 个或 10,000 个或我们想要的任意数量的引导样本。

方法二：自己写公式

计算引导标准误差的另一种方法是编写我们自己的函数。

以下代码展示了如何执行此操作：

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

引导的标准错误结果是2.497414 。

请注意，此标准误差与前面示例中计算的标准误差非常相似。

关于作者

本杰明·安德森博

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多

方法 1：使用入门包

方法二：自己写公式

关于作者

本杰明·安德森博

添加评论