Comment calculer l’écart type dans R (avec exemples)



Vous pouvez utiliser la syntaxe suivante pour calculer l’écart type d’un vecteur dans R :

sd(x)

Notez que cette formule calcule l’écart type de l’échantillon à l’aide de la formule suivante :

Σ (x je – μ) 2 / (n-1)

où:

  • Σ : Un symbole fantaisiste qui signifie « somme »
  • x i : la ième valeur de l’ensemble de données
  • μ : La valeur moyenne de l’ensemble de données
  • n : La taille de l’échantillon

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : calculer l’écart type du vecteur

Le code suivant montre comment calculer l’écart type d’un seul vecteur dans R :

#create dataset
data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23)

#find standard deviation
sd(data)

[1] 8.279157

Notez que vous devez utiliser na.rm = TRUE pour calculer l’écart type s’il manque des valeurs dans l’ensemble de données :

#create dataset with missing values
data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23)

#attempt to find standard deviation
sd(data)

[1] NA

#find standard deviation and specify to ignore missing values
sd(data, na.rm = TRUE)

[1] 9.179753

Exemple 2 : calculer l’écart type d’une colonne dans un bloc de données

Le code suivant montre comment calculer l’écart type d’une seule colonne dans un bloc de données :

#create data frame
data <- data.frame(a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of column a
sd(data$a)

[1] 3.060501

Exemple 3 : calculer l’écart type de plusieurs colonnes dans un bloc de données

Le code suivant montre comment calculer l’écart type de plusieurs colonnes dans un bloc de données :

#create data frame
data <- data.frame(a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of specific columns in data frame
apply(data[ , c('a', 'c', 'd')], 2, sd)

       a        c        d 
3.060501 4.289522 9.544632 

Ressources additionnelles

Comment trouver la plage dans R
Comment calculer la variance de l’échantillon et de la population dans R
Comment supprimer les valeurs aberrantes dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *