如何使用 r 中的 tabulate() 函数计算整数出现次数
R中的tabulate()函数可用于统计向量中整数值的出现次数。
该函数使用以下基本语法:
制表(bin,nbins = max(1,bin,na.rm = TRUE))
金子:
- bin :向量名称
- nbins :要使用的 bin 数量
以下示例展示了如何在实践中使用此功能。
示例 1:计算向量中整数出现的次数
以下代码演示如何使用tabulate()函数来计算给定向量中整数的出现次数:
#create vector of data values data <- c(1, 1, 1, 2, 3, 3, 3, 4, 7, 8) #count occurrences of integers in vector tabulate(data) [1] 3 1 3 1 0 0 1 1
默认情况下, tabulate()函数使用 1 作为最小整数值,并显示向量中每个连续整数的出现次数。
例如:
- 整数 1 在向量中出现3次。
- 整数 2 在向量中出现1次。
- 整数 3 在向量中出现3次。
- 整数 4 在向量中出现1次。
- 整数 5 在向量中出现0次。
等等。
请注意,如果使用nbins参数,您只需限制tabulate()函数考虑的整数数量:
#count occurrences of integers but limit output to 5 tabulate(data, nbins= 5 ) [1] 3 1 3 1 0
示例 2:计算带小数位的向量中整数的出现次数
如果我们将tabulate()函数与包含小数位的向量一起使用,该函数将简单地告诉我们每个整数值出现的频率:
#create vector of data values with decimals data <- c(1.2, 1.4, 1.7, 2, 3.1, 3.5) #count occurrences of integers tabulate(data) [1] 3 1 2
从结果我们可以看出:
- 整数值 1 出现了3次。
- 整数值 2 出现1次。
- 整数值 3 出现了2次。
示例 3:计算向量中负值整数的出现次数
如果我们将tabulate()函数与包含负值或零的向量一起使用,该函数将简单地忽略负值和零:
#create vector with some negative values and zeros data <- c(-5, -5, -2, 0, 1, 1, 2, 4) #count occurrences of integers tabulate(data) [1] 2 1 0 1
从结果我们可以看出:
- 整数值 1 出现了2次。
- 整数值 2 出现1次。
- 整数值 3 出现0次。
- 整数值 4 出现了1次。
制表的替代方法:table() 函数
如果要统计向量中每个值的出现次数,最好使用table()函数:
#create vector with a variety of numbers data <- c(-5, -5, -2, 0, 1, 1, 2.5, 4) #count occurrences of each unique value in vector table(data) data -5 -2 0 1 2.5 4 2 1 1 2 1 1
从结果我们可以看出:
- 值-5出现了2次。
- 值 -2 出现1次。
- 值 0 出现1次。
- 值 1 出现了2次。
- 值 2.5 出现1次。
- 值 4 出现1次。
请注意, table()函数计算每个值的出现次数,而不仅仅是整数值。
其他资源
以下教程解释了如何使用 R 中的其他常用函数: