如何在 r 中创建频率表(附示例)
频率表是显示不同类别的频率的表格。这种类型的表对于理解数据集中值的分布特别有用。
本教程介绍如何使用以下数据框在 R 中创建频率表:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(store= rep (c(' A ', ' B ', ' C '), each = 3 ), sales= round (runif(9, 2, 6), 0 ), returns= round (runif(9, 1, 3), 0 )) #view data frame df store sales returns 1 to 6 2 2 to 3 1 3 to 3 1 4 B 4 1 5 B 6 2 6 B 3 2 7 C 6 3 8 C 6 2 9 C 5 2
R 中的单向频率表
以下代码展示了如何在 R 中为变量存储创建单向频率表:
#calculate frequency of each store
table(df$store)
ABC
3 3 3
这张表只是告诉我们:
- 商店 A 在数据框中出现 3 次。
- 商店 B 在数据框中出现 3 次。
- 商店 C 在数据框中出现 3 次。
R 中的双向频率表
以下代码显示如何在 R 中为store和sales变量创建双向频率表:
#calculate two-way frequency table
table(df$store, df$sales)
3 4 5 6
A 2 0 0 1
B 1 1 0 1
C 0 0 1 2
这张表告诉我们:
- A 商店在 2 个不同的场合进行了 3 次销售。
- A 店 0 次有 4 次销售。
- A 店 0 次有 5 次销售。
- A 商店 1 次完成 1 次销售。
等等。
R中的三向频率表
以下代码显示了如何为数据框中的三个变量创建三向频率表:
#calculate three-way frequency table
table(df$store, df$sales, df$returns)
, , = 1
3 4 5 6
A 2 0 0 0
B 0 1 0 0
C 0 0 0 0
, , = 2
3 4 5 6
A 0 0 0 1
B 1 0 0 1
C 0 0 1 1
, , = 3
3 4 5 6
A 0 0 0 0
B 0 0 0 0
C 0 0 0 1
第一个表告诉我们当退货次数等于 1 时按商店列出的总销售额。第二个表告诉我们当退货次数等于 2 时按商店列出的总销售额。第三个表告诉我们当退货次数等于 2 时按商店列出的总销售额。当返回数等于3时存储。
请注意,R 可以创建更高维度的频率表(例如 4 路频率表、5 路频率表),但对于更高维度,输出可能会变得相当大。
在实践中,最常用的是单向和双向频率表。