Як підрахувати кількість входжень у стовпці в r


Ви можете використовувати такий синтаксис у R, щоб підрахувати кількість входжень певних значень у стовпцях кадру даних:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

Наведені нижче приклади показують, як використовувати цей синтаксис на практиці з таким кадром даних:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

Приклад 1: підрахунок входжень значень у стовпці

У наведеному нижче коді показано, як підрахувати кількість входжень кожного значення в стовпець «команда»:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

Це говорить нам:

  • Назва команди «Mavs» з’являється 2 рази.
  • Назва команди «Nets» з’являється 3 рази.
  • Назва команди «Suns» з’являється 1 раз.

Приклад 2: Підрахунок входжень значень у стовпці (включаючи значення NA)

У наведеному нижче коді показано, як підрахувати кількість входжень кожного значення (включаючи значення NA) у стовпці «points»:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

Це говорить нам:

  • Значення 20 з’являється 1 раз.
  • Значення 22 з’являється 1 раз.
  • Значення 26 з’являється 1 раз.
  • Значення 30 з’являється двічі.
  • Значення NA (відсутнє значення) з’являється 1 раз.

Приклад 3: Підрахунок випадків певного значення в стовпці

Наступний код показує, як підрахувати кількість входжень значення 30 у стовпці «points»:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

Це говорить нам про те, що значення 30 з’являється двічі в стовпці «бали».

Ви також можете використовувати наступний синтаксис, щоб підрахувати кількість входжень кількох різних значень у стовпці «балів»:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

Це говорить нам про те, що значення 30 або 26 з’являється загалом 3 рази в стовпці «бали».

Додаткові ресурси

Як підсумувати певні стовпці в R
Як обчислити середнє значення кількох стовпців у R
Як знайти максимальне значення в кількох стовпцях у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *