Как подсчитать количество вхождений в столбцах в r
Вы можете использовать следующий синтаксис в R для подсчета количества вхождений определенных значений в столбцы фрейма данных:
#count number of occurrences of each value in column table(df$column_name) #count number of occurrences of each value (including NA values) in column table(df$column_name, useNA = ' always ') #count number of occurrences of specific value length(which(df$column_name== value ))
Следующие примеры показывают, как использовать этот синтаксис на практике со следующим фреймом данных:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'), team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'), points=c(20, 22, 26, 30, 30, NA)) #view data frame df player team points 1 A Mavs 20 2 B Mavs 22 3 C Suns 26 4 D Nets 30 5 E Nets 30 6 F Nets NA
Пример 1. Подсчет вхождений значений в столбец
Следующий код показывает, как подсчитать количество вхождений каждого значения в столбце «команда»:
#count number of occurrences of each team
table(df$team)
Mavs Nets Suns
2 3 1
Это говорит нам:
- Название команды «Мавс» встречается 2 раза.
- Название команды «Нетс» появляется 3 раза.
- Название команды «Санз» появляется 1 раз.
Пример 2. Подсчет вхождений значений в столбец (включая значения NA)
Следующий код показывает, как подсчитать количество вхождений каждого значения (включая значения NA) в столбце «точки»:
#count number of occurrences of each value in 'points', including NA occurrences table(df$points, useNA = ' always ') 20 22 26 30 <NA> 1 1 1 2 1
Это говорит нам:
- Значение 20 появляется 1 раз.
- Значение 22 появляется 1 раз.
- Значение 26 появляется 1 раз.
- Значение 30 появляется дважды.
- Значение NA (отсутствующее значение) появляется 1 раз.
Пример 3. Подсчет вхождений определенного значения в столбец
Следующий код показывает, как подсчитать количество вхождений значения 30 в столбце «точки»:
#count number of occurrences of the value 30 in 'points' column length(which(df$points == 30 )) [1] 2
Это говорит нам о том, что значение 30 появляется дважды в столбце «баллы».
Вы также можете использовать следующий синтаксис для подсчета количества вхождений нескольких разных значений в столбце «точки»:
#count number of occurrences of the value 30 or 26 in 'points' column length(which(df$points == 30 | df$points == 26 )) [1] 3
Это говорит нам о том, что значение 30 или 26 появляется в общей сложности 3 раза в столбце «баллы».
Дополнительные ресурсы
Как суммировать определенные столбцы в R
Как вычислить среднее значение нескольких столбцов в R
Как найти максимальное значение в нескольких столбцах в R