Plage par rapport à l’écart type : quand utiliser chacun
La plage et l’écart type sont deux façons de mesurer la répartition des valeurs dans un ensemble de données.
La plage représente la différence entre la valeur minimale et la valeur maximale dans un ensemble de données.
L’ écart type mesure l’écart typique des valeurs individuelles par rapport à la valeur moyenne. Il est calculé comme suit :
s = √(Σ(x je – x ) 2 / (n-1))
où:
- Σ : Un symbole qui signifie « somme »
- x i : La valeur de la ième observation dans l’échantillon
- x : La moyenne de l’échantillon
- n : La taille de l’échantillon
Par exemple, supposons que nous ayons l’ensemble de données suivant :
Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
La plage est calculée comme suit : 31 -1 = 32.
Nous pouvons utiliser une calculatrice pour constater que l’ écart type est de 9,25.
Plage et écart type : similarités et différences
La plage et l’écart type partagent la similitude suivante :
- Les deux métriques mesurent la répartition des valeurs dans un ensemble de données.
Cependant, la plage et l’écart type présentent la différence suivante :
- La plage nous indique la différence entre la valeur la plus grande et la plus petite de l’ensemble de données.
- L’écart type nous indique l’écart typique des valeurs individuelles par rapport à la valeur moyenne de l’ensemble de données.
Plage par rapport à l’écart type : quand utiliser chacun
Nous devons utiliser la plage lorsque nous souhaitons comprendre la différence entre les valeurs les plus grandes et les plus petites d’un ensemble de données.
Par exemple, supposons qu’un professeur fasse passer un examen à 100 étudiants. Elle peut utiliser l’échelle pour comprendre la différence entre le score le plus élevé et le score le plus bas obtenu par tous les élèves de la classe.
À l’inverse, nous devrions utiliser l’ écart type lorsque nous souhaitons comprendre dans quelle mesure la valeur typique d’un ensemble de données s’écarte de la valeur moyenne.
Par exemple, si un professeur fait passer un examen à 100 étudiants, il peut utiliser l’écart type pour quantifier dans quelle mesure la note typique de l’examen s’écarte de la note moyenne de l’examen.
Il convient de noter que nous n’avons pas à choisir entre utiliser la plage ou l’écart type pour décrire la répartition des valeurs dans un ensemble de données. Nous pouvons utiliser les deux métriques car elles nous fournissent des informations complètement différentes.
Les inconvénients de la plage et de l’écart type
La plage et l’écart type souffrent tous deux d’un inconvénient : ils sont tous deux influencés par des valeurs aberrantes .
Pour illustrer cela, considérons l’ensemble de données suivant :
Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Nous pouvons calculer les valeurs suivantes pour la plage et l’écart type de cet ensemble de données :
- Portée : 31
- Écart type : 9,25
Cependant, considérez si l’ensemble de données présentait une valeur aberrante extrême :
Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Nous pourrions utiliser une calculatrice pour trouver les métriques suivantes pour cet ensemble de données :
- Portée : 377
- Écart type : 85,02
Remarquez comment la plage et l’écart type changent considérablement en raison d’une valeur aberrante.
Bien que la plage et l’écart type puissent être des mesures utiles pour avoir une idée de la répartition des valeurs dans un ensemble de données, vous devez d’abord vous assurer que l’ensemble de données ne contient aucune valeur aberrante qui influence ces mesures. Sinon, la plage et l’écart type peuvent être trompeurs.