Comment normaliser les données dans Google Sheets



Normaliser un ensemble de valeurs de données signifie mettre les valeurs à l’échelle de telle sorte que la moyenne de toutes les valeurs soit 0 et l’écart type soit 1.

Ce tutoriel explique comment normaliser les données dans Google Sheets.

Exemple : Comment normaliser les données dans Google Sheets

Supposons que nous ayons l’ensemble de données suivant dans Google Sheets :

Utilisez les étapes suivantes pour normaliser cet ensemble de valeurs de données.

Étape 1 : Calculez la moyenne.

Tout d’abord, nous utiliserons la fonction =AVERAGE(plage de valeurs) pour trouver la moyenne de l’ensemble de données.

Étape 2 : Trouvez l’écart type.

Ensuite, nous utiliserons la fonction =STDEV (plage de valeurs) pour trouver l’écart type de l’ensemble de données.

Étape 3 : Normalisez les valeurs.

Enfin, nous utiliserons la fonction STANDARDIZE(x, Mean, standard_dev) pour normaliser chacune des valeurs de l’ensemble de données.

NOTE:

La fonction STANDARDIZE utilise la formule suivante pour normaliser une valeur de données donnée :

Valeur normalisée = (x – x ) / s

où:

  • x = valeur des données
  • x = moyenne de l’ensemble de données
  • s = écart type de l’ensemble de données

L’image suivante montre la formule utilisée pour normaliser la première valeur de l’ensemble de données :

Données normalisées dans Google Sheets

Une fois que nous avons normalisé la première valeur de la cellule B2, nous pouvons passer la souris sur le coin inférieur droit de la cellule B2 jusqu’à ce qu’un petit + apparaisse. Double-cliquez sur le + pour copier la formule dans les cellules restantes :

Ensemble de données normalisé dans Google Sheets

Désormais, chaque valeur de l’ensemble de données est normalisée.

Comment interpréter les données normalisées

La formule que nous avons utilisée pour normaliser une valeur de données donnée, x, était la suivante :

Valeur normalisée = (x – x ) / s

où:

  • x = valeur des données
  • x = moyenne de l’ensemble de données
  • s = écart type de l’ensemble de données

Si un point de données particulier a une valeur normalisée supérieure à 0, cela signifie que le point de données est supérieur à la moyenne. À l’inverse, une valeur normalisée inférieure à 0 indique que le point de données est inférieur à la moyenne.

En particulier, la valeur normalisée nous indique de combien d’écarts types se trouve le point de données d’origine par rapport à la moyenne. Par exemple, considérons le point de données « 12 » dans notre ensemble de données d’origine :

Ensemble de données normalisé dans Google Sheets

La valeur normalisée pour « 12 » s’est avérée être de -1,288, calculée comme suit :

Valeur normalisée = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288

Cela nous indique que la valeur « 12 » est inférieure de 1,288 écarts-types à la moyenne de l’ensemble de données d’origine.

Chacune des valeurs normalisées de l’ensemble de données peut nous aider à comprendre à quel point une valeur de données particulière est proche ou éloignée de la moyenne. Une petite valeur normalisée indique qu’une valeur est proche de la moyenne tandis qu’une grande valeur normalisée indique qu’une valeur est éloignée de la moyenne.

Ressources additionnelles

Comment normaliser les données dans Excel
Comment normaliser les données dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *