Jak obliczyć procent według grupy w r (z przykładem)


Aby obliczyć procent według grupy w R, możesz użyć następującej składni:

 library (dplyr)

df %>%
  group_by(group_var) %>%
  mutate(percent = value_var/sum(value_var))

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Oblicz procent według grupy w R

Załóżmy, że mamy następującą ramkę danych przedstawiającą punkty zdobyte przez koszykarzy z różnych drużyn:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'),
                 points=c(12, 29, 34, 14, 10, 11, 7, 36, 34, 22))

#view data frame
df

   team points
1 to 12
2 to 29
3 to 34
4 to 14
5 to 10
6 B 11
7 B 7
8 B 36
9 B 34
10 B 22

Możemy użyć poniższego kodu, aby utworzyć nową kolumnę w ramce danych, która wyświetla procent wszystkich zdobytych punktów, pogrupowanych według drużyn:

 library (dplyr)

#calculate percentage of points scored, grouped by team
df %>%
  group_by(team) %>%
  mutate(percent = points/sum(points))

# A tibble: 10 x 3
# Groups: team [2]
   team points percent
        
 1 to 12 0.121 
 2 A 29 0.293 
 3 A 34 0.343 
 4 A 14 0.141 
 5 A 10 0.101 
 6 B 11 0.1   
 7 B 7 0.0636
 8 B 36 0.327 
 9 B 34 0.309 
10 B 22 0.2 

Kolumna Procent wskazuje procent wszystkich punktów zdobytych przez tego gracza w jego drużynie.

Na przykład gracze Drużyny A zdobyli łącznie 99 punktów.

Zatem gracz w pierwszym rzędzie ramki danych, który zdobył 12 punktów, zdobył w sumie 12/99 = 12,12% całkowitej liczby punktów Drużyny A.

Podobnie zawodnik z drugiego rzędu w bazie danych, który zdobył 29 punktów, uzyskał łącznie 29/99 = 29,29% łącznej liczby punktów Drużyny A.

I tak dalej.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak policzyć unikalne wartości według grupy w R
Jak obliczyć statystyki podsumowujące według grup w R
Jak obliczyć sumę według grupy w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *