Pourquoi la plage est-elle importante dans les statistiques ?
En statistiques, la plage représente la différence entre la valeur la plus petite et la plus grande d’un ensemble de données.
Par exemple, supposons que nous ayons l’ensemble de données suivant :
Ensemble de données : 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26
Nous pouvons utiliser la formule suivante pour calculer la plage :
- Plage = Valeur maximale – Valeur minimale
- Plage = 26 – 3
- Plage = 23
La portée est de 23 . Cela représente la différence entre les valeurs les plus petites et les plus grandes de l’ensemble de données.
En statistiques, la plage est importante pour les raisons suivantes :
Raison 1 : Cela nous indique la répartition de l’ensemble des données.
Raison 2 : Cela nous indique quelles valeurs extrêmes sont possibles dans un ensemble de données donné.
Les exemples suivants illustrent chacune de ces raisons dans la pratique.
Raison 1 : la plage nous indique la répartition d’un ensemble de données entier
La plage nous indique la répartition d’un ensemble de données entier.
Par exemple, supposons que nous disposions de l’ensemble de données suivant qui montre les résultats aux examens de 20 étudiants différents dans une classe :
La fourchette des résultats des examens serait calculée comme suit :
- Plage = Valeur maximale – Valeur minimale
- Plage = 98 – 68
- Plage = 30
La portée s’avère être de 30 . Cela représente la différence entre la note la plus élevée à l’examen et la note la plus basse de la classe.
Connaissant précisément cette mesure, l’enseignant de la classe peut comprendre rapidement la répartition des valeurs dans les résultats des examens parmi tous les élèves.
Raison 2 : La plage nous indique quelles valeurs extrêmes sont possibles dans un ensemble de données donné
La plage nous indique quelles valeurs extrêmes sont possibles dans un ensemble de données donné.
Par exemple, supposons qu’un agent immobilier ait accès à une base de données contenant le prix de vente de 100 000 maisons dans une certaine ville des États-Unis :
Supposons que nous utilisions un logiciel statistique (comme Excel , R , Python , etc.) pour calculer la plage de cet ensemble de données et trouver ce qui suit :
- Plage = valeur maximale – valeur minimale
- Fourchette = 854 000 – 194 000
- Portée = 660 000
Si l’agent immobilier a un client qui dispose d’un budget d’achat inférieur à 194 000 $ ou supérieur à 854 000 $, l’agent immobilier peut immédiatement savoir qu’aucune maison dans cette ville particulière ne répondra aux critères d’achat.
L’inconvénient de l’utilisation de la plage
La fourchette souffre d’un inconvénient : elle est influencée par les valeurs aberrantes .
Pour illustrer cela, considérons l’ensemble de données suivant :
Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
La plage de cet ensemble de données est 32 – 1 = 31 .
Cependant, considérez si l’ensemble de données présentait une valeur aberrante extrême :
Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
La plage de cet ensemble de données serait désormais 378 – 1 = 377 .
Remarquez comment la plage change radicalement en raison d’une valeur aberrante.
Avant de calculer la plage d’un ensemble de données, c’est une bonne idée de vérifier d’abord s’il existe des valeurs aberrantes qui pourraient rendre la plage trompeuse.
Ressources additionnelles
Les didacticiels suivants expliquent l’importance d’autres mesures dans les statistiques :
Pourquoi la moyenne est-elle importante en statistiques ?
Pourquoi la médiane est-elle importante dans les statistiques ?
Pourquoi le mode est-il important dans les statistiques ?
Pourquoi l’écart type est-il important dans les statistiques ?