如何在 r 中计算五个数的和(附示例)
五位数汇总是一种使用以下五个值汇总一组数据的方法:
- 最低限度
- 第一个四分位数
- 中位数
- 第三个四分位数
- 最大值
五数汇总很有用,因为它提供了数据分布的简明汇总,如下所示:
- 它使用中位数告诉我们 中值在哪里。
- 它使用第一和第三四分位数告诉我们数据的分布。
- 它使用最小值和最大值告诉我们数据的范围。
在 R 中计算数据集的五数汇总的最简单方法是使用 R 基础中的Fivenum()函数:
fivenum(data)
以下示例展示了如何在实践中使用此语法。
示例 1:向量的五数概括
以下代码展示了如何在 R 中计算数值向量的五数汇总:
#define numeric vector data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22) #calculate five number summary of data fivenum(data) [1] 4 7 12 15 22
从结果我们可以看出:
- 最少: 4
- 第一个四分位数: 7
- 中位数: 12
- 第三个四分位数: 15
- 最多: 22
我们可以通过创建箱线图来快速可视化五位数字的摘要:
boxplot(data) [1] 4 7 12 15 22
以下是解释箱线图的方法:
- 图表底部的线代表最小值 ( 4 )。
- 框底部的线代表第一个四分位数 ( 7 )。
- 方框中间的线代表中位数 ( 12 )。
- 框顶部的线代表第三个四分位数 ( 15 )。
- 图表顶部的线代表最大值 ( 22 )。
示例 2:数据框中某列的五位数摘要
以下代码显示如何计算数据框中特定列的五位摘要:
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(99, 90, 86, 88, 95, 87, 85, 89), assists=c(33, 28, 31, 39, 34, 30, 29, 25), rebounds=c(30, 28, 24, 24, 28, 30, 31, 35)) #calculate five number summary of points column fivenum(df$points) [1] 85.0 86.5 88.5 92.5 99.0
示例 3:多列的五位数摘要
以下代码展示了如何使用sapply()函数同时计算数据框中多列的五位汇总:
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(99, 90, 86, 88, 95, 87, 85, 89), assists=c(33, 28, 31, 39, 34, 30, 29, 25), rebounds=c(30, 28, 24, 24, 28, 30, 31, 35)) #calculate five number summary of points, assists, and rebounds column sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum) points assists rebounds [1,] 85.0 25.0 24.0 [2,] 86.5 28.5 26.0 [3,] 88.5 30.5 29.0 [4,] 92.5 33.5 30.5 [5,] 99.0 39.0 35.0
相关: R 中 apply()、lapply()、sapply() 和 tapply() 指南