Як обчислити співвідношення в r (з прикладами)
Для обчислення співвідношення між значеннями двох стовпців в R можна використовувати такі методи:
Спосіб 1: Використовуйте Base R
#calculate ratio between variable1 and variable2 df$ratio <- df$variable1/df$variable1 #calculate ratio between variable1 and variable2, rounded to 2 decimal places df$ratio <- round(df$variable1/df$variable2, 2 )
Спосіб 2: використовуйте dplyr
library (dplyr) #calculate ratio between variable1 and variable2 df <- df %>% mutate(ratio = variable1/variable2) #calculate ratio between variable1 and variable2, rounded to 2 decimal places df <- df %>% mutate(ratio = round(variable1/variable2, 2 ))
У цьому підручнику пояснюється, як використовувати кожен метод на практиці з наступним кадром даних, який показує загальну кількість кидків, виконаних різними баскетболістами:
#create data frame
df <- data. frame (players=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
makes=c(4, 4, 3, 6, 7, 8, 3, 10),
attempts=c(12, 7, 5, 6, 10, 12, 5, 19))
#view data frame
df
players makes attempts
1 to 4 12
2 B 4 7
3 C 3 5
4 D 6 6
5 E 7 10
6 F 8 12
7 G 3 5
8:10:19 a.m.
Приклад 1: обчисліть коефіцієнти з використанням бази R
Наступний код показує, як обчислити співвідношення між значеннями стовпців оцінок і спроб за допомогою бази R:
#calculate ratio between makes and attempts columns
df$ratio <- df$makes/df$attempts
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Співвідношення спроб до спроб для першого гравця становить 4/12 = 0,33 .
Іншими словами, перший гравець виконав близько 33% своїх кидків.
Таким же чином ми можемо інтерпретувати значення співвідношення для всіх інших гравців.
Ми також можемо використовувати функцію round() , щоб округлити значення співвідношення до певної кількості знаків після коми:
#calculate ratio between makes and attempts columns, rounded to 2 decimal places
df$ratio <- round(df$makes/df$attempts, 2 )
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Кожне зі значень у стовпці співвідношення тепер округлено до двох знаків після коми.
Приклад 2: обчислення коефіцієнтів за допомогою dplyr
Наступний код показує, як обчислити співвідношення між значеннями в стовпцях оцінок і спроб за допомогою пакета dplyr :
library (dplyr)
#add new column that shows ratio of makes to attempts
df <- df %>%
mutate(ratio = makes/attempts)
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Ми також можемо використовувати функцію round() , щоб округлити значення співвідношення до певної кількості знаків після коми:
library (dplyr)
#add new column that shows ratio of makes to attempts, rounded to 2 decimal places
df <- df %>%
mutate(ratio = round(makes/attempts, 2 ))
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Кожне зі значень у стовпці співвідношення тепер округлено до двох знаків після коми.
Зверніть увагу, що метод base R і метод dplyr дають однакові результати.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в R:
Як фільтрувати унікальні значення за допомогою dplyr
Як фільтрувати за кількома умовами за допомогою dplyr
Як підрахувати кількість входжень у стовпці в R