Hoe kwantielen per groep in r te berekenen (met voorbeelden)
In de statistieken zijn kwantielen waarden die een geclassificeerde dataset in gelijke groepen verdelen.
Om kwantielen te berekenen die gegroepeerd zijn op een bepaalde variabele in R, kunnen we de volgende functies uit het dplyr- pakket in R gebruiken:
library (dplyr) #define quantiles of interest q = c(.25, .5, .75) #calculate quantiles by grouping variable df %>% group_by(grouping_variable) %>% summarize(quant25 = quantile (numeric_variable, probs = q[1]), quant50 = quantile (numeric_variable, probs = q[2]), quant75 = quantile (numeric_variable, probs = q[3]))
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeelden: Kwantielen per groep in R
De volgende code laat zien hoe je kwantielen kunt berekenen van het aantal overwinningen gegroepeerd per team voor een dataset in R:
library (dplyr) #create data df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C'), wins=c(2, 4, 4, 5, 7, 9, 13, 13, 15, 15, 14, 13, 11, 9, 9, 8, 8, 16, 19, 21, 24, 20, 19, 18)) #view first six rows of data head(df) team wins 1 TO 2 2 to 4 3 to 4 4 to 5 5 TO 7 6 to 9 #define quantiles of interest q = c(.25, .5, .75) #calculate quantiles by grouping variable df %>% group_by(team) %>% summarize(quant25 = quantile (wins, probs = q[1]), quant50 = quantile (wins, probs = q[2]), quant75 = quantile (wins, probs = q[3])) team quant25 quant50 quant75 1 to 4 6 10 2 B 9 12 14.2 3 C 17.5 19 20.2
Merk op dat we ook elk gewenst aantal kwantielen kunnen specificeren:
#define quantiles of interest q = c(.2, .4, .6, .8) #calculate quantiles by grouping variable df %>% group_by(team) %>% summarize(quant20 = quantile (wins, probs = q[1]), quant40 = quantile (wins, probs = q[2]), quant60 = quantile (wins, probs = q[3]), quant80 = quantile (wins, probs = q[4])) team quant20 quant40 quant60 quant80 1 to 4 4.8 7.4 11.4 2 B 9 10.6 13.2 14.6 3 C 16.8 18.8 19.2 20.6
U kunt er ook voor kiezen om per groep één kwantiel te berekenen. Zo berekent u bijvoorbeeld het 90e percentiel van het aantal overwinningen van elk team:
#calculate 90th percentile of wins by team df %>% group_by(team) %>% summarize(quant90 = quantile (wins, probs = 0.9 )) team quant90 1 to 13 2 B 15 3 C 21.9
Aanvullende bronnen
Hoe kwartielen in R te berekenen
Hoe decielen in R te berekenen
Hoe percentielen in R te berekenen