Comment normaliser les données entre -1 et 1



Pour normaliser les valeurs d’un ensemble de données entre -1 et 1, vous pouvez utiliser la formule suivante :

z je = 2 * ((x je – x min ) / (x max – x min )) – 1

où:

  • z i : la ième valeur normalisée dans l’ensemble de données
  • x i : la ième valeur de l’ensemble de données
  • x min : La valeur minimale dans l’ensemble de données
  • x max : La valeur maximale dans l’ensemble de données

Par exemple, supposons que nous ayons l’ensemble de données suivant :

La valeur minimale dans l’ensemble de données est 13 et la valeur maximale est 71.

Pour normaliser la première valeur de 13 , nous appliquerions la formule partagée précédemment :

  • z je = 2 * ((x je – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1

Pour normaliser la deuxième valeur de 16 , nous utiliserions la même formule :

  • z je = 2 * ((x je – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897

Pour normaliser la troisième valeur de 19 , nous utiliserions la même formule :

  • z je = 2 * ((x je – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793

Nous pouvons utiliser exactement cette même formule pour normaliser chaque valeur de l’ensemble de données d’origine entre -1 et 1 :

Chaque valeur de l’ensemble de données normalisé est désormais comprise entre -1 et 1.

En utilisant cette méthode de normalisation, les affirmations suivantes seront toujours vraies :

  • La valeur normalisée pour la valeur minimale dans l’ensemble de données sera toujours -1.
  • La valeur normalisée pour la valeur maximale dans l’ensemble de données sera toujours 1.
  • Les valeurs normalisées pour toutes les autres valeurs de l’ensemble de données seront comprises entre -1 et 1.

Quand normaliser les données

Souvent, nous normalisons les variables lorsque nous effectuons un certain type d’analyse dans laquelle nous avons plusieurs variables mesurées à différentes échelles et nous souhaitons que chacune des variables ait la même plage.

Cela évite qu’une variable ait trop d’influence, surtout si elle est mesurée dans des unités différentes (c’est-à-dire si une variable est mesurée en pouces et une autre en yards).

Notez également que la méthode de normalisation que nous avons utilisée ici n’est qu’une option possible.

Dans certains cas, il est judicieux de normaliser les variables entre 0 et 1, voire entre 0 et 100.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres types de normalisation :

Comment normaliser les données entre 0 et 1
Comment normaliser les données entre 0 et 100

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *