Comment calculer l’écart médian absolu dans R



L’ écart absolu médian mesure la répartition des observations dans un ensemble de données.

Il s’agit d’une mesure particulièrement utile car elle est moins affectée par les valeurs aberrantes que d’autres mesures de dispersion telles que l’écart type et la variance.

La formule pour calculer l’écart médian absolu, souvent abrégé MAD, est la suivante :

MAD = médiane (|x i – x m |)

où:

  • x i : la ième valeur de l’ensemble de données
  • x m : La valeur médiane dans l’ensemble de données

Les exemples suivants montrent comment calculer l’écart absolu médian dans R à l’aide de la fonction mad() intégrée.

Exemple 1 : calculer le MAD pour un vecteur

Le code suivant montre comment calculer l’écart absolu médian pour un seul vecteur dans R :

#define data
data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24)

#calculate MAD
mad(data)

[1] 11.1195

L’écart absolu médian pour l’ensemble de données s’avère être de 11,1195 .

Exemple 2 : calculer MAD pour une colonne dans un bloc de données

Le code suivant montre comment calculer MAD pour une seule colonne dans un bloc de données :

#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
                   y = c(3, 4, 6, 8, 8, 9, 19),
                   z = c(2, 2, 2, 3, 5, 8, 11))

#calculate MAD for column y in data frame
mad(data$y)

[1] 2.9652

L’écart médian absolu pour la colonne y s’avère être de 2,9652 .

Exemple 3 : Calculer MAD pour plusieurs colonnes dans un bloc de données

Le code suivant montre comment calculer MAD pour plusieurs colonnes dans un bloc de données à l’aide de la fonction sapply() :

#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
                   y = c(3, 4, 6, 8, 8, 9, 19),
                   z = c(2, 2, 2, 3, 5, 8, 11))

#calculate MAD for all columns in data frame
sapply(data, mad)

     x      y      z 
2.9652 2.9652 1.4826

L’écart médian absolu est de 2,9652 pour la colonne x, de 2,9652 pour la colonne y et de 1,4826 pour la colonne z.

Connexe : Un guide pour apply(), lapply(), sapply() et tapply() dans R

Ressources additionnelles

Comment calculer MAPE dans R
Comment calculer MSE dans R
Comment calculer le RMSE dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *