如何在 r 中创建帕累托图(分步)
帕累托图是一种显示不同类别的频率以及类别的累积频率的图表。
本教程提供了在 R 中创建 Pareto 图的分步示例。
第 1 步:创建数据
假设我们进行一项调查,要求 350 名不同的人在品牌 A、B、C、D 和 E 之间找出他们最喜欢的谷物品牌。
以下数据集显示了每个品牌的总票数:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
第 2 步:创建帕累托图
要创建帕累托图来可视化本次调查的结果,我们可以使用qcc包中的pareto.chart()函数:
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
输出表向我们展示了每个品牌的频率和累积频率。例如:
- 品牌A频率: 140 |累计频率: 140
- 品牌B频率: 97 | A、B的累计频率: 237
- C 标志出现频率: 58 | A、B、C 的累积频率: 295
等等。
第 3 步:编辑帕累托图(可选)
以下代码显示了如何修改图表的标题以及使用的调色板:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
您可以在此 R Color 备忘单中找到可用调色板的完整列表。