Como calcular proporções em r (com exemplos)
Você pode usar os seguintes métodos para calcular a razão entre os valores de duas colunas em R:
Método 1: Use Base R
#calculate ratio between variable1 and variable2 df$ratio <- df$variable1/df$variable1 #calculate ratio between variable1 and variable2, rounded to 2 decimal places df$ratio <- round(df$variable1/df$variable2, 2 )
Método 2: use dplyr
library (dplyr) #calculate ratio between variable1 and variable2 df <- df %>% mutate(ratio = variable1/variable2) #calculate ratio between variable1 and variable2, rounded to 2 decimal places df <- df %>% mutate(ratio = round(variable1/variable2, 2 ))
Este tutorial explica como usar cada método na prática com o seguinte quadro de dados que mostra o número total de arremessos feitos e tentados por diferentes jogadores de basquete:
#create data frame
df <- data. frame (players=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
makes=c(4, 4, 3, 6, 7, 8, 3, 10),
attempts=c(12, 7, 5, 6, 10, 12, 5, 19))
#view data frame
df
players makes attempts
1 to 4 12
2 B 4 7
3 C 3 5
4 D 6 6
5 E 7 10
6 F 8 12
7 G 3 5
8:10:19 a.m.
Exemplo 1: Calcular proporções usando a base R
O código a seguir mostra como calcular a razão entre os valores das colunas de marcas e tentativas usando a base R:
#calculate ratio between makes and attempts columns
df$ratio <- df$makes/df$attempts
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
A proporção de tentativas para tentativas do primeiro jogador é 4/12 = 0,33 .
Ou seja, o primeiro jogador acertou cerca de 33% das tentativas de chute.
Podemos interpretar os valores das proporções para todos os outros jogadores da mesma maneira.
Também podemos usar a função round() para arredondar valores de proporção para um certo número de casas decimais:
#calculate ratio between makes and attempts columns, rounded to 2 decimal places
df$ratio <- round(df$makes/df$attempts, 2 )
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Cada um dos valores na coluna de proporção agora é arredondado para duas casas decimais.
Exemplo 2: Calcular proporções usando dplyr
O código a seguir mostra como calcular a proporção entre os valores nas colunas de marcas e tentativas usando o pacote dplyr :
library (dplyr)
#add new column that shows ratio of makes to attempts
df <- df %>%
mutate(ratio = makes/attempts)
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Também podemos usar a função round() para arredondar valores de proporção para um certo número de casas decimais:
library (dplyr)
#add new column that shows ratio of makes to attempts, rounded to 2 decimal places
df <- df %>%
mutate(ratio = round(makes/attempts, 2 ))
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Cada um dos valores na coluna de proporção agora é arredondado para duas casas decimais.
Observe que o método base R e o método dplyr produzem os mesmos resultados.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como filtrar valores únicos usando dplyr
Como filtrar por múltiplas condições usando dplyr
Como contar o número de ocorrências em colunas em R