Как использовать функцию tabulate() в r для подсчета вхождений целых чисел
Функцию tabulate() в R можно использовать для подсчета вхождений целочисленных значений в вектор.
Эта функция использует следующий базовый синтаксис:
tabulate(bin, nbins=max(1, bin, na.rm=TRUE))
Золото:
- bin : имя вектора
- nbins : количество используемых ячеек.
Следующие примеры показывают, как использовать эту функцию на практике.
Пример 1. Подсчет целых чисел в векторе
Следующий код показывает, как использовать функцию tabulate() для подсчета вхождений целых чисел в заданный вектор:
#create vector of data values data <- c(1, 1, 1, 2, 3, 3, 3, 4, 7, 8) #count occurrences of integers in vector tabulate(data) [1] 3 1 3 1 0 0 1 1
По умолчанию функция tabulate() использует 1 в качестве минимального целочисленного значения и отображает вхождения каждого последующего целого числа в векторе.
Например:
- Целое число 1 встречается в векторе 3 раза.
- Целое число 2 появляется в векторе 1 раз.
- Целое число 3 встречается в векторе 3 раза.
- Целое число 4 встречается в векторе 1 раз.
- Целое число 5 встречается в векторе 0 раз.
И так далее.
Обратите внимание: если вы используете аргумент nbins , вы просто ограничиваете количество целых чисел, рассматриваемых функцией tabulate() :
#count occurrences of integers but limit output to 5 tabulate(data, nbins= 5 ) [1] 3 1 3 1 0
Пример 2. Подсчет вхождений целых чисел в вектор с десятичными знаками
Если мы используем функцию tabulate() с вектором, содержащим десятичные знаки, функция просто сообщит нам, как часто появляется каждое целочисленное значение:
#create vector of data values with decimals data <- c(1.2, 1.4, 1.7, 2, 3.1, 3.5) #count occurrences of integers tabulate(data) [1] 3 1 2
По результату мы видим:
- Целочисленное значение 1 появилось 3 раза.
- Целочисленное значение 2 встречалось 1 раз.
- Целочисленное значение 3 появилось 2 раза.
Пример 3. Подсчет вхождений целых чисел в вектор с отрицательными значениями
Если мы используем функцию tabulate() с вектором, содержащим отрицательные значения или нули, функция просто проигнорирует отрицательные значения и нули:
#create vector with some negative values and zeros data <- c(-5, -5, -2, 0, 1, 1, 2, 4) #count occurrences of integers tabulate(data) [1] 2 1 0 1
По результату мы видим:
- Целочисленное значение 1 появилось 2 раза.
- Целочисленное значение 2 встречалось 1 раз.
- Целочисленное значение 3 встречалось 0 раз.
- Целочисленное значение 4 встречалось 1 раз.
Альтернатива табуляции: функция table().
Если вы хотите подсчитать появление каждого значения в векторе, лучше всего использовать функцию table() :
#create vector with a variety of numbers data <- c(-5, -5, -2, 0, 1, 1, 2.5, 4) #count occurrences of each unique value in vector table(data) data -5 -2 0 1 2.5 4 2 1 1 2 1 1
По результату мы видим:
- Значение -5 встречалось 2 раза.
- Значение -2 возникло 1 раз.
- Значение 0 произошло 1 раз.
- Значение 1 появилось 2 раза.
- Значение 2,5 встречалось 1 раз.
- Значение 4 произошло 1 раз.
Обратите внимание, что функция table() подсчитывает появление каждого значения, а не только целочисленных значений.
Дополнительные ресурсы
В следующих руководствах объясняется, как использовать другие распространенные функции в R:
Как использовать функцию summary() в R
Как использовать функцию репликации() в R
Как использовать функцию match() в R