如何计算 r 中的标准差(附示例)
您可以使用以下语法来计算 R 中向量的标准差:
sd(x)
请注意,此公式使用以下公式计算样本标准差:
√ Σ ( xi – μ) 2 / (n-1)
金子:
- Σ :一个奇特的符号,意思是“和”
- x i :数据集的第 i 个值
- μ :数据集的平均值
- n:样本量
以下示例展示了如何在实践中使用此功能。
示例1:计算向量的标准差
以下代码展示了如何计算 R 中单个向量的标准差:
#create dataset data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23) #find standard deviation sd(data) [1] 8.279157
请注意,如果数据集中存在缺失值,则必须使用na.rm = TRUE来计算标准差:
#create dataset with missing values data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23) #attempt to find standard deviation sd(data) [1] NA #find standard deviation and specify to ignore missing values sd(data, na. rm = TRUE ) [1] 9.179753
示例 2:计算数据框中某列的标准差
以下代码展示了如何计算数据框中单列的标准差:
#create data frame data <- data. frame (a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #find standard deviation of column a sd(data$a) [1] 3.060501
示例 3:计算数据框中多列的标准差
以下代码展示了如何计算数据框中多列的标准差:
#create data frame data <- data. frame (a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #find standard deviation of specific columns in data frame apply(data[, c(' a ', ' c ', ' d ')], 2, sd) acd 3.060501 4.289522 9.544632