Comment calculer l’écart type à l’aide de dplyr (avec exemples)
Vous pouvez utiliser les méthodes suivantes pour calculer l’écart type des valeurs dans un bloc de données dans dplyr :
Méthode 1 : calculer l’écart type d’une variable
library(dplyr) df %>% summarise(sd_var1 = sd(var1, na.rm=TRUE))
Méthode 2 : calculer l’écart type de plusieurs variables
library(dplyr) df %>% summarise(sd_var1 = sd(var1, na.rm=TRUE), sd_var2 = sd(var2, na.rm=TRUE))
Méthode 3 : calculer l’écart type de plusieurs variables, regroupées par une autre variable
library(dplyr) df %>% group_by(var3) %>% summarise(sd_var1 = sd(var1, na.rm=TRUE), sd_var2 = sd(var2, na.rm=TRUE))
Ce tutoriel explique comment utiliser chaque méthode en pratique avec le bloc de données suivant dans R :
#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(12, 15, 18, 22, 14, 17, 29, 35),
assists=c(4, 4, 3, 6, 7, 8, 3, 10))
#view data frame
df
team points assists
1 A 12 4
2 A 15 4
3 A 18 3
4 A 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10
Exemple 1 : calculer l’écart type d’une variable
Le code suivant montre comment calculer l’écart type de la variable points :
library(dplyr) #calculate standard deviation of points variable df %>% summarise(sd_points = sd(points, na.rm=TRUE)) sd_points 1 7.995534
À partir du résultat, nous pouvons voir que l’écart type des valeurs de la variable points est 7,995534 .
Exemple 2 : calculer l’écart type de plusieurs variables
Le code suivant montre comment calculer l’écart type des points et des variables d’assistance :
library(dplyr) #calculate standard deviation of points and assists variables df %>% summarise(sd_points = sd(points, na.rm=TRUE), sd_assists = sd(assists, na.rm=TRUE)) sd_points sd_assists 1 7.995534 2.559994
La sortie affiche l’écart type pour les variables de points et d’assistance .
Exemple 3 : calculer l’écart type de plusieurs variables, regroupées par une autre variable
Le code suivant montre comment calculer l’écart type des points et des variables d’assistance :
library(dplyr) #calculate standard deviation of points and assists variables df %>% group_by(team) %>% summarise(sd_points = sd(points, na.rm=TRUE), sd_assists = sd(assists, na.rm=TRUE)) # A tibble: 2 x 3 team sd_points sd_assists 1 A 4.27 1.26 2 B 9.91 2.94
Le résultat affiche l’écart type pour les variables de points et d’assistance pour l’équipe A et l’équipe B.
Remarque : Vous pouvez inclure une liste de plusieurs variables dans la fonction group_by() si vous souhaitez regrouper par plusieurs variables.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment filtrer les valeurs uniques à l’aide de dplyr
Comment filtrer selon plusieurs conditions à l’aide de dplyr
Comment compter le nombre d’occurrences dans les colonnes de R