Comment calculer l’écart type dans R (avec exemples)
Vous pouvez utiliser la syntaxe suivante pour calculer l’écart type d’un vecteur dans R :
sd(x)
Notez que cette formule calcule l’écart type de l’échantillon à l’aide de la formule suivante :
√ Σ (x je – μ) 2 / (n-1)
où:
- Σ : Un symbole fantaisiste qui signifie « somme »
- x i : la ième valeur de l’ensemble de données
- μ : La valeur moyenne de l’ensemble de données
- n : La taille de l’échantillon
Les exemples suivants montrent comment utiliser cette fonction dans la pratique.
Exemple 1 : calculer l’écart type du vecteur
Le code suivant montre comment calculer l’écart type d’un seul vecteur dans R :
#create dataset data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23) #find standard deviation sd(data) [1] 8.279157
Notez que vous devez utiliser na.rm = TRUE pour calculer l’écart type s’il manque des valeurs dans l’ensemble de données :
#create dataset with missing values data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23) #attempt to find standard deviation sd(data) [1] NA #find standard deviation and specify to ignore missing values sd(data, na.rm = TRUE) [1] 9.179753
Exemple 2 : calculer l’écart type d’une colonne dans un bloc de données
Le code suivant montre comment calculer l’écart type d’une seule colonne dans un bloc de données :
#create data frame data <- data.frame(a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #find standard deviation of column a sd(data$a) [1] 3.060501
Exemple 3 : calculer l’écart type de plusieurs colonnes dans un bloc de données
Le code suivant montre comment calculer l’écart type de plusieurs colonnes dans un bloc de données :
#create data frame data <- data.frame(a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #find standard deviation of specific columns in data frame apply(data[ , c('a', 'c', 'd')], 2, sd) a c d 3.060501 4.289522 9.544632
Ressources additionnelles
Comment trouver la plage dans R
Comment calculer la variance de l’échantillon et de la population dans R
Comment supprimer les valeurs aberrantes dans R