Как рассчитать процент по группе в r (с примером)
Вы можете использовать следующий синтаксис для расчета процента по группе в R:
library (dplyr)
df %>%
group_by(group_var) %>%
mutate(percent = value_var/sum(value_var))
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: вычислить процент по группе в R
Предположим, у нас есть следующий кадр данных, в котором показаны очки, набранные баскетболистами разных команд:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'),
points=c(12, 29, 34, 14, 10, 11, 7, 36, 34, 22))
#view data frame
df
team points
1 to 12
2 to 29
3 to 34
4 to 14
5 to 10
6 B 11
7 B 7
8 B 36
9 B 34
10 B 22
Мы можем использовать следующий код, чтобы создать новый столбец во фрейме данных, который отображает процент от общего количества набранных очков, сгруппированных по командам:
library (dplyr) #calculate percentage of points scored, grouped by team df %>% group_by(team) %>% mutate(percent = points/sum(points)) # A tibble: 10 x 3 # Groups: team [2] team points percent 1 to 12 0.121 2 A 29 0.293 3 A 34 0.343 4 A 14 0.141 5 A 10 0.101 6 B 11 0.1 7 B 7 0.0636 8 B 36 0.327 9 B 34 0.309 10 B 22 0.2
В столбце «Процент» указан процент от общего количества очков, набранных данным игроком в его команде.
Например, игроки команды А набрали в общей сложности 99 очков.
Таким образом, игрок в первой строке таблицы данных, набравший 12 очков, набрал в общей сложности 12/99 = 12,12% от общего количества очков команды А.
Аналогично, игрок второй строки в базе данных, набравший 29 очков, набрал в общей сложности 29/99 = 29,29% от общего количества очков Команды А.
И так далее.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как посчитать уникальные значения по группам в R
Как рассчитать сводную статистику по группам в R
Как рассчитать сумму по группе в R