如何计算 r 中平均值的标准误差
平均值的标准误差是衡量数据集中值分布的一种方法。计算方法如下:
标准误差 = s / √n
金子:
- s :样本标准差
- n :样本量
本教程介绍了两种可用于计算 R 中数据集的标准误差的方法。
方法一:使用Plotrix库
计算平均值标准误差的第一种方法是使用 Plotrix 库的内置std.error()函数。
下面的代码展示了如何使用这个函数:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
平均值的标准误差为2.001447 。
方法2:定义自己的函数
计算数据集平均值的标准误差的另一种方法是简单地定义您自己的函数。
以下代码展示了如何执行此操作:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
同样,平均值的标准误差为2.0014 。
如何解释平均值的标准误
均值的标准误差只是对均值周围值的分布的度量。
解释平均值的标准误差时需要记住两件事:
1.均值的标准误差越大,数据集中的值在均值周围越分散。
为了说明这一点,考虑一下我们是否将前一个数据集的最后一个值更改了一个更大的数字:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
请注意标准误差如何从2.001447增加到6.978265 。
这表明与之前的数据集相比,该数据集中的值更分布在平均值附近。
2.随着样本量的增加,平均值的标准误差趋于减小。
为了说明这一点,请考虑以下两组数据的平均值的标准误差:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
第二个数据集只是第一个数据集重复两次。
因此,两个数据集具有相同的均值,但第二个数据集的样本量较大,因此标准误差较小。
其他资源
以下教程解释了如何在 R 中执行其他常见任务: