Comment calculer l’écart type à l’aide de dplyr (avec exemples)

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Vous pouvez utiliser les méthodes suivantes pour calculer l’écart type des valeurs dans un bloc de données dans dplyr :

Méthode 1 : calculer l’écart type d’une variable

library(dplyr)

df %>%
  summarise(sd_var1 = sd(var1, na.rm=TRUE))

Méthode 2 : calculer l’écart type de plusieurs variables

library(dplyr)

df %>%
  summarise(sd_var1 = sd(var1, na.rm=TRUE),
            sd_var2 = sd(var2, na.rm=TRUE))

Méthode 3 : calculer l’écart type de plusieurs variables, regroupées par une autre variable

library(dplyr)

df %>%
  group_by(var3) %>%
  summarise(sd_var1 = sd(var1, na.rm=TRUE),
            sd_var2 = sd(var2, na.rm=TRUE))

Ce tutoriel explique comment utiliser chaque méthode en pratique avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 15, 18, 22, 14, 17, 29, 35),
                 assists=c(4, 4, 3, 6, 7, 8, 3, 10))

#view data frame
df

  team points assists
1    A     12       4
2    A     15       4
3    A     18       3
4    A     22       6
5    B     14       7
6    B     17       8
7    B     29       3
8    B     35      10

Exemple 1 : calculer l’écart type d’une variable

Le code suivant montre comment calculer l’écart type de la variable points :

library(dplyr)

#calculate standard deviation of points variable
df %>%
  summarise(sd_points = sd(points, na.rm=TRUE))

  sd_points
1  7.995534

À partir du résultat, nous pouvons voir que l’écart type des valeurs de la variable points est 7,995534 .

Exemple 2 : calculer l’écart type de plusieurs variables

Le code suivant montre comment calculer l’écart type des points et des variables d’assistance :

library(dplyr)

#calculate standard deviation of points and assists variables
df %>%
  summarise(sd_points = sd(points, na.rm=TRUE),
            sd_assists = sd(assists, na.rm=TRUE))

  sd_points sd_assists
1  7.995534   2.559994

La sortie affiche l’écart type pour les variables de points et d’assistance .

Exemple 3 : calculer l’écart type de plusieurs variables, regroupées par une autre variable

Le code suivant montre comment calculer l’écart type des points et des variables d’assistance :

library(dplyr)

#calculate standard deviation of points and assists variables
df %>%
  group_by(team) %>%
  summarise(sd_points = sd(points, na.rm=TRUE),
            sd_assists = sd(assists, na.rm=TRUE))

# A tibble: 2 x 3
  team  sd_points sd_assists
             
1 A          4.27       1.26
2 B          9.91       2.94

Le résultat affiche l’écart type pour les variables de points et d’assistance pour l’équipe A et l’équipe B.

Remarque : Vous pouvez inclure une liste de plusieurs variables dans la fonction group_by() si vous souhaitez regrouper par plusieurs variables.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment filtrer les valeurs uniques à l’aide de dplyr
Comment filtrer selon plusieurs conditions à l’aide de dplyr
Comment compter le nombre d’occurrences dans les colonnes de R

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus