如何在 r 中创建帕累托图(分步)


帕累托图是一种显示不同类别的频率以及类别的累积频率的图表。

R 中的帕累托图

本教程提供了在 R 中创建 Pareto 图的分步示例。

第 1 步:创建数据

假设我们进行一项调查,要求 350 名不同的人在品牌 A、B、C、D 和 E 之间找出他们最喜欢的谷物品牌。

以下数据集显示了每个品牌的总票数:

 #createdata
df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
                 count=c(140, 97, 58, 32, 17, 6))

#viewdata
df

  favorite count
1 to 140
2 B 97
3 C 58
4 D 32
5 E 17
6 F 6

第 2 步:创建帕累托图

要创建帕累托图来可视化本次调查的结果,我们可以使用qcc包中的pareto.chart()函数:

 library (qcc)

#create Pareto chart
pareto. chart (df$count)

Pareto chart analysis for df$count
     Frequency Cum.Freq. Percentage Cum.Percent.
  A 140.000000 140.000000 40.000000 40.000000
  B 97.000000 237.000000 27.714286 67.714286
  C 58.000000 295.000000 16.571429 84.285714
  D 32.000000 327.000000 9.142857 93.428571
  E 17.000000 344.000000 4.857143 98.285714
  F 6.000000 350.000000 1.714286 100.000000

输出表向我们展示了每个品牌的频率和累积频率。例如:

  • 品牌A频率: 140 |累计频率: 140
  • 品牌B频率: 97 | A、B的累计频率: 237
  • C 标志出现频率: 58 | A、B、C 的累积频率: 295

等等。

第 3 步:编辑帕累托图(可选)

以下代码显示了如何修改图表的标题以及使用的调色板:

 pareto. chart (df$count,
             main=' Pareto Chart for Favorite Cereal Brands ',
             col=heat. colors ( length (df$count))) 

R 中的帕累托图

您可以在此 R Color 备忘单中找到可用调色板的完整列表。

其他资源

如何在 R 中创建频率表
如何在 R 中创建相对频率直方图
如何计算R中的累积和

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注