Normalisation du score Z : définition & Exemples

Par Dr. Benjamin Anderson juillet 23, 2023 Guide 0 commentaire

La normalisation du score Z fait référence au processus de normalisation de chaque valeur d’un ensemble de données de telle sorte que la moyenne de toutes les valeurs soit de 0 et l’écart type soit de 1.

Nous utilisons la formule suivante pour effectuer une normalisation du score z sur chaque valeur d’un ensemble de données :

Nouvelle valeur = (x – μ) / σ

où:

x : Valeur d’origine
μ : Moyenne des données
σ : Écart type des données

L’exemple suivant montre comment effectuer une normalisation du score z sur un ensemble de données dans la pratique.

Exemple : exécution de la normalisation du score Z

Supposons que nous ayons l’ensemble de données suivant :

À l’aide d’une calculatrice, nous pouvons constater que la moyenne de l’ensemble de données est de 21,2 et l’écart type est de 29,8 .

Pour effectuer une normalisation du z-score sur la première valeur de l’ensemble de données, nous pouvons utiliser la formule suivante :

Nouvelle valeur = (x – μ) / σ
Nouvelle valeur = (3 – 21,2) / 29,8
Nouvelle valeur = -0,61

Nous pouvons utiliser cette formule pour effectuer une normalisation du score z sur chaque valeur de l’ensemble de données :

La moyenne des valeurs normalisées est 0 et l’écart type des valeurs normalisées est 1 .

Les valeurs normalisées représentent le nombre d’écarts types entre la valeur d’origine et la moyenne.

Par exemple:

La première valeur de l’ensemble de données est de 0,61 écart-type en dessous de la moyenne.
La deuxième valeur de l’ensemble de données est de 0,54 écart-type en dessous de la moyenne.
…
La dernière valeur de l’ensemble de données est de 3,79 écarts types au-dessus de la moyenne.

L’avantage d’effectuer ce type de normalisation est que la valeur aberrante évidente dans l’ensemble de données (134) a été transformée de telle manière qu’elle n’est plus une valeur aberrante massive.

Si nous utilisons ensuite cet ensemble de données pour ajuster un certain type de modèle d’apprentissage automatique , la valeur aberrante n’aura plus autant d’influence qu’elle pourrait avoir sur l’ajustement du modèle.

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur différentes techniques de normalisation :

Standardisation ou normalisation : quelle est la différence ?
Comment normaliser les données entre 0 et 1
Comment normaliser les données entre 0 et 100

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus

Exemple : exécution de la normalisation du score Z

Ressources additionnelles

à propos de l'auteur

Dr. Benjamin Anderson

Ajouter un commentaire