Come calcolare i rapporti in r (con esempi)
È possibile utilizzare i seguenti metodi per calcolare il rapporto tra i valori di due colonne in R:
Metodo 1: utilizzare Base R
#calculate ratio between variable1 and variable2 df$ratio <- df$variable1/df$variable1 #calculate ratio between variable1 and variable2, rounded to 2 decimal places df$ratio <- round(df$variable1/df$variable2, 2 )
Metodo 2: usa dplyr
library (dplyr) #calculate ratio between variable1 and variable2 df <- df %>% mutate(ratio = variable1/variable2) #calculate ratio between variable1 and variable2, rounded to 2 decimal places df <- df %>% mutate(ratio = round(variable1/variable2, 2 ))
Questo tutorial spiega come utilizzare ciascun metodo nella pratica con il seguente frame di dati che mostra il numero totale di tiri effettuati e tentati da diversi giocatori di basket:
#create data frame
df <- data. frame (players=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
makes=c(4, 4, 3, 6, 7, 8, 3, 10),
attempts=c(12, 7, 5, 6, 10, 12, 5, 19))
#view data frame
df
players makes attempts
1 to 4 12
2 B 4 7
3 C 3 5
4 D 6 6
5 E 7 10
6 F 8 12
7 G 3 5
8:10:19 a.m.
Esempio 1: calcolare i rapporti utilizzando la base R
Il codice seguente mostra come calcolare il rapporto tra i valori delle colonne dei voti e dei tentativi utilizzando la base R:
#calculate ratio between makes and attempts columns
df$ratio <- df$makes/df$attempts
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Il rapporto tra tentativi e tentativi per il primo giocatore è 4/12 = 0,33 .
In altre parole, il primo giocatore ha effettuato circa il 33% dei tentativi di tiro.
Possiamo interpretare i valori del rapporto per tutti gli altri giocatori allo stesso modo.
Possiamo anche utilizzare la funzione round() per arrotondare i valori del rapporto a un certo numero di cifre decimali:
#calculate ratio between makes and attempts columns, rounded to 2 decimal places
df$ratio <- round(df$makes/df$attempts, 2 )
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Ciascuno dei valori nella colonna del rapporto è ora arrotondato a due cifre decimali.
Esempio 2: calcolare i rapporti utilizzando dplyr
Il codice seguente mostra come calcolare il rapporto tra i valori nelle colonne mark e tentativi utilizzando il pacchetto dplyr :
library (dplyr)
#add new column that shows ratio of makes to attempts
df <- df %>%
mutate(ratio = makes/attempts)
#view updated data frame
df
players makes attempts ratio
1 A 4 12 0.3333333
2 B 4 7 0.5714286
3 C 3 5 0.6000000
4 D 6 6 1.0000000
5 E 7 10 0.7000000
6 F 8 12 0.6666667
7 G 3 5 0.6000000
8:10:19 AM 0.5263158
Possiamo anche utilizzare la funzione round() per arrotondare i valori del rapporto a un certo numero di cifre decimali:
library (dplyr)
#add new column that shows ratio of makes to attempts, rounded to 2 decimal places
df <- df %>%
mutate(ratio = round(makes/attempts, 2 ))
#view updated data frame
df
players makes attempts ratio
1 to 4 12 0.33
2 B 4 7 0.57
3 C 3 5 0.60
4 D 6 6 1.00
5 E 7 10 0.70
6 F 8 12 0.67
7 G 3 5 0.60
8:10:19 0.53
Ciascuno dei valori nella colonna del rapporto è ora arrotondato a due cifre decimali.
Si noti che il metodo base R e il metodo dplyr producono gli stessi risultati.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come filtrare valori univoci utilizzando dplyr
Come filtrare in base a più condizioni utilizzando dplyr
Come contare il numero di occorrenze nelle colonne in R