Как рассчитать коэффициенты в r (с примерами)
Для расчета отношения значений двух столбцов в R можно использовать следующие методы:
Метод 1: используйте базу R
#calculate ratio between variable1 and variable2 df$ratio <- df$variable1/df$variable1 #calculate ratio between variable1 and variable2, rounded to 2 decimal places df$ratio <- round(df$variable1/df$variable2, 2 )
Способ 2: используйте dplyr
library (dplyr) #calculate ratio between variable1 and variable2 df <- df %>% mutate(ratio = variable1/variable2) #calculate ratio between variable1 and variable2, rounded to 2 decimal places df <- df %>% mutate(ratio = round(variable1/variable2, 2 ))
В этом руководстве объясняется, как использовать каждый метод на практике, с помощью следующего кадра данных, который показывает общее количество сделанных и предпринятых бросков разными баскетболистами:
#create data frame
df <- data. frame (players=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
makes=c(4, 4, 3, 6, 7, 8, 3, 10),
attempts=c(12, 7, 5, 6, 10, 12, 5, 19))
#view data frame
df
players makes attempts
1 to 4 12
2 B 4 7
3 C 3 5
4 D 6 6
5 E 7 10
6 F 8 12
7 G 3 5
8:10:19 a.m.
Пример 1. Расчет коэффициентов с использованием базы R
Следующий код показывает, как вычислить соотношение между значениями столбцов оценок и попыток с использованием базы R:
#calculate ratio between makes and attempts columns
df$ratio <- df$makes/df$attempts
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Соотношение попыток к попыткам для первого игрока составляет 4/12 = 0,33 .
Другими словами, первый игрок совершил около 33% попыток броска.
Точно так же мы можем интерпретировать значения коэффициентов для всех остальных игроков.
Мы также можем использовать функцию round() для округления значений коэффициентов до определенного количества десятичных знаков:
#calculate ratio between makes and attempts columns, rounded to 2 decimal places
df$ratio <- round(df$makes/df$attempts, 2 )
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Каждое из значений в столбце соотношения теперь округляется до двух десятичных знаков.
Пример 2. Расчет коэффициентов с помощью dplyr
Следующий код показывает, как вычислить соотношение между значениями в столбцах оценок и попыток с помощью пакета dplyr :
library (dplyr)
#add new column that shows ratio of makes to attempts
df <- df %>%
mutate(ratio = makes/attempts)
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Мы также можем использовать функцию round() для округления значений коэффициентов до определенного количества десятичных знаков:
library (dplyr)
#add new column that shows ratio of makes to attempts, rounded to 2 decimal places
df <- df %>%
mutate(ratio = round(makes/attempts, 2 ))
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Каждое из значений в столбце соотношения теперь округляется до двух десятичных знаков.
Обратите внимание, что базовый метод R и метод dplyr дают одинаковые результаты.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как фильтровать уникальные значения с помощью dplyr
Как фильтровать по нескольким условиям с помощью dplyr
Как подсчитать количество вхождений в столбцах в R