Как использовать функцию tabulate() в r для подсчета вхождений целых чисел


Функцию tabulate() в R можно использовать для подсчета вхождений целочисленных значений в вектор.

Эта функция использует следующий базовый синтаксис:

tabulate(bin, nbins=max(1, bin, na.rm=TRUE))

Золото:

  • bin : имя вектора
  • nbins : количество используемых ячеек.

Следующие примеры показывают, как использовать эту функцию на практике.

Пример 1. Подсчет целых чисел в векторе

Следующий код показывает, как использовать функцию tabulate() для подсчета вхождений целых чисел в заданный вектор:

 #create vector of data values
data <- c(1, 1, 1, 2, 3, 3, 3, 4, 7, 8)

#count occurrences of integers in vector
tabulate(data)

[1] 3 1 3 1 0 0 1 1

По умолчанию функция tabulate() использует 1 в качестве минимального целочисленного значения и отображает вхождения каждого последующего целого числа в векторе.

Например:

  • Целое число 1 встречается в векторе 3 раза.
  • Целое число 2 появляется в векторе 1 раз.
  • Целое число 3 встречается в векторе 3 раза.
  • Целое число 4 встречается в векторе 1 раз.
  • Целое число 5 встречается в векторе 0 раз.

И так далее.

Обратите внимание: если вы используете аргумент nbins , вы просто ограничиваете количество целых чисел, рассматриваемых функцией tabulate() :

 #count occurrences of integers but limit output to 5
tabulate(data, nbins= 5 )

[1] 3 1 3 1 0

Пример 2. Подсчет вхождений целых чисел в вектор с десятичными знаками

Если мы используем функцию tabulate() с вектором, содержащим десятичные знаки, функция просто сообщит нам, как часто появляется каждое целочисленное значение:

 #create vector of data values with decimals
data <- c(1.2, 1.4, 1.7, 2, 3.1, 3.5)

#count occurrences of integers
tabulate(data)

[1] 3 1 2

По результату мы видим:

  • Целочисленное значение 1 появилось 3 раза.
  • Целочисленное значение 2 встречалось 1 раз.
  • Целочисленное значение 3 появилось 2 раза.

Пример 3. Подсчет вхождений целых чисел в вектор с отрицательными значениями

Если мы используем функцию tabulate() с вектором, содержащим отрицательные значения или нули, функция просто проигнорирует отрицательные значения и нули:

 #create vector with some negative values and zeros
data <- c(-5, -5, -2, 0, 1, 1, 2, 4)

#count occurrences of integers
tabulate(data)

[1] 2 1 0 1

По результату мы видим:

  • Целочисленное значение 1 появилось 2 раза.
  • Целочисленное значение 2 встречалось 1 раз.
  • Целочисленное значение 3 встречалось 0 раз.
  • Целочисленное значение 4 встречалось 1 раз.

Альтернатива табуляции: функция table().

Если вы хотите подсчитать появление каждого значения в векторе, лучше всего использовать функцию table() :

 #create vector with a variety of numbers
data <- c(-5, -5, -2, 0, 1, 1, 2.5, 4)

#count occurrences of each unique value in vector
table(data)

data
 -5 -2 0 1 2.5 4 
  2 1 1 2 1 1

По результату мы видим:

  • Значение -5 встречалось 2 раза.
  • Значение -2 возникло 1 раз.
  • Значение 0 произошло 1 раз.
  • Значение 1 появилось 2 раза.
  • Значение 2,5 встречалось 1 раз.
  • Значение 4 произошло 1 раз.

Обратите внимание, что функция table() подсчитывает появление каждого значения, а не только целочисленных значений.

Дополнительные ресурсы

В следующих руководствах объясняется, как использовать другие распространенные функции в R:

Как использовать функцию summary() в R
Как использовать функцию репликации() в R
Как использовать функцию match() в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *