Comment calculer les scores Z modifiés dans Excel



En statistiques, un z-score modifié est calculé comme suit :

Score z modifié = 0,6745 (x i – x̃) / MAD

où:

  • x i : une seule valeur de données
  • x̃ : La médiane de l’ensemble de données
  • MAD : l’écart absolu médian de l’ensemble de données

Un score z modifié est plus robuste qu’un score z ordinaire car il utilise la médiane dans sa formule par opposition à la moyenne, qui est connue pour être influencée par les valeurs aberrantes .

Iglewicz et Hoaglin recommandent que les valeurs dont les scores z modifiés sont inférieurs à -3,5 ou supérieurs à 3,5 soient étiquetées comme valeurs aberrantes potentielles.

L’exemple étape par étape suivant montre comment calculer les scores z modifiés pour un ensemble de données donné dans Excel.

Étape 1 : Créer les données

Tout d’abord, nous allons créer l’ensemble de données suivant contenant 16 valeurs :

Étape 2 : Calculer la médiane

Ensuite, nous calculerons la médiane de l’ensemble de données :

La médiane s’avère être de 16 .

Étape 3 : Calculez la différence absolue entre chaque valeur et la médiane

Ensuite, nous calculerons la différence absolue entre chaque valeur et la médiane :

La différence absolue entre la première valeur des données et la médiane s’avère être de 16.

Ensuite, cliquez sur la cellule B2. Passez ensuite la souris sur le coin inférieur droit de la cellule jusqu’à ce qu’une petite croix ( + ) apparaisse.

Double-cliquez sur la croix pour copier et coller cette formule dans toutes les cellules restantes de la colonne :

Étape 4 : Calculer l’écart médian absolu

Ensuite, nous utiliserons la formule suivante pour calculer l’écart absolu médian de l’ensemble de données :

L’écart médian absolu s’avère être de 8 .

Étape 5 : Trouvez le score Z modifié pour chaque valeur de données

Enfin, nous pouvons calculer le z-score modifié pour chaque valeur de données à l’aide de la formule suivante :

Score z modifié = 0,6745 (x i – x̃) / MAD

Par exemple, le score z modifié pour la première valeur de données est calculé comme suit :

Score z modifié dans Excel

Ensuite, cliquez sur la cellule C2. Passez ensuite la souris sur le coin inférieur droit de la cellule jusqu’à ce qu’une petite croix ( + ) apparaisse.

Double-cliquez sur la croix pour copier et coller cette formule dans toutes les cellules restantes de la colonne :

Nous pouvons voir qu’aucune valeur de l’ensemble de données n’a un score z modifié inférieur à -3,5 ou supérieur à 3,5, nous ne qualifions donc aucune valeur de cet ensemble de données de valeur aberrante potentielle.

Comment gérer les valeurs aberrantes

Si une valeur aberrante est présente dans votre ensemble de données, vous disposez de plusieurs options :

  • Assurez-vous que la valeur aberrante n’est pas le résultat d’une erreur de saisie de données. Parfois, un individu saisit simplement une mauvaise valeur de données lors de l’enregistrement des données. Si une valeur aberrante est présente, vérifiez d’abord que la valeur a été saisie correctement et qu’il ne s’agissait pas d’une erreur.
  • Attribuez une nouvelle valeur à la valeur aberrante . Si la valeur aberrante s’avère être le résultat d’une erreur de saisie de données, vous pouvez décider de lui attribuer une nouvelle valeur telle que la moyenne ou la médiane de l’ensemble de données.
  • Supprimez la valeur aberrante. Si la valeur est réellement aberrante, vous pouvez choisir de la supprimer si elle aura un impact significatif sur votre analyse globale. Assurez-vous simplement de mentionner dans votre rapport ou analyse final que vous avez supprimé une valeur aberrante.

Ressources additionnelles

Comment calculer les scores Z dans Excel
Comment calculer l’intervalle interquartile (IQR) dans Excel
Comment calculer le milieu de gamme dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *