如何在 r 中计算五个数的和(附示例)


五位数汇总是一种使用以下五个值汇总一组数据的方法:

  • 最低限度
  • 第一个四分位数
  • 中位数
  • 第三个四分位数
  • 最大值

五数汇总很有用,因为它提供了数据分布的简明汇总,如下所示:

  • 它使用中位数告诉我们 中值在哪里。
  • 它使用第一和第三四分位数告诉我们数据的分布。
  • 它使用最小值和最大值告诉我们数据的范围。

在 R 中计算数据集的五数汇总的最简单方法是使用 R 基础中的Fivenum()函数:

 fivenum(data)

以下示例展示了如何在实践中使用此语法。

示例 1:向量的五数概括

以下代码展示了如何在 R 中计算数值向量的五数汇总:

 #define numeric vector
data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22)

#calculate five number summary of data
fivenum(data)

[1] 4 7 12 15 22

从结果我们可以看出:

  • 最少: 4
  • 第一个四分位数: 7
  • 中位数: 12
  • 第三个四分位数: 15
  • 最多: 22

我们可以通过创建箱线图来快速可视化五位数字的摘要:

 boxplot(data)

[1] 4 7 12 15 22 

以下是解释箱线图的方法:

  • 图表底部的线代表最小值 ( 4 )。
  • 框底部的线代表第一个四分位数 ( 7 )。
  • 方框中间的线代表中位数 ( 12 )。
  • 框顶部的线代表第三个四分位数 ( 15 )。
  • 图表顶部的线代表最大值 ( 22 )。

示例 2:数据框中某列的五位数摘要

以下代码显示如何计算数据框中特定列的五位摘要:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points column
fivenum(df$points)

[1] 85.0 86.5 88.5 92.5 99.0

示例 3:多列的五位数摘要

以下代码展示了如何使用sapply()函数同时计算数据框中多列的五位汇总:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points, assists, and rebounds column
sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum)

     points assists rebounds
[1,] 85.0 25.0 24.0
[2,] 86.5 28.5 26.0
[3,] 88.5 30.5 29.0
[4,] 92.5 33.5 30.5
[5,] 99.0 39.0 35.0

相关: R 中 apply()、lapply()、sapply() 和 tapply() 指南

其他资源

如何在 R 中创建汇总表
如何在R中找到范围
如何去除R中的异常值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注