Normalisation du score Z : définition & Exemples



La normalisation du score Z fait référence au processus de normalisation de chaque valeur d’un ensemble de données de telle sorte que la moyenne de toutes les valeurs soit de 0 et l’écart type soit de 1.

Nous utilisons la formule suivante pour effectuer une normalisation du score z sur chaque valeur d’un ensemble de données :

Nouvelle valeur = (x – μ) / σ

où:

  • x : Valeur d’origine
  • μ : Moyenne des données
  • σ : Écart type des données

L’exemple suivant montre comment effectuer une normalisation du score z sur un ensemble de données dans la pratique.

Exemple : exécution de la normalisation du score Z

Supposons que nous ayons l’ensemble de données suivant :

À l’aide d’une calculatrice, nous pouvons constater que la moyenne de l’ensemble de données est de 21,2 et l’écart type est de 29,8 .

Pour effectuer une normalisation du z-score sur la première valeur de l’ensemble de données, nous pouvons utiliser la formule suivante :

  • Nouvelle valeur = (x – μ) / σ
  • Nouvelle valeur = (3 – 21,2) / 29,8
  • Nouvelle valeur = -0,61

Nous pouvons utiliser cette formule pour effectuer une normalisation du score z sur chaque valeur de l’ensemble de données :

La moyenne des valeurs normalisées est 0 et l’écart type des valeurs normalisées est 1 .

Les valeurs normalisées représentent le nombre d’écarts types entre la valeur d’origine et la moyenne.

Par exemple:

  • La première valeur de l’ensemble de données est de 0,61 écart-type en dessous de la moyenne.
  • La deuxième valeur de l’ensemble de données est de 0,54 écart-type en dessous de la moyenne.
  • La dernière valeur de l’ensemble de données est de 3,79 écarts types au-dessus de la moyenne.

L’avantage d’effectuer ce type de normalisation est que la valeur aberrante évidente dans l’ensemble de données (134) a été transformée de telle manière qu’elle n’est plus une valeur aberrante massive.

Si nous utilisons ensuite cet ensemble de données pour ajuster un certain type de modèle d’apprentissage automatique , la valeur aberrante n’aura plus autant d’influence qu’elle pourrait avoir sur l’ajustement du modèle.

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur différentes techniques de normalisation :

Standardisation ou normalisation : quelle est la différence ?
Comment normaliser les données entre 0 et 1
Comment normaliser les données entre 0 et 100

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *