Quand utiliser la moyenne par rapport à la médiane : avec des exemples



La moyenne d’un ensemble de données représente la valeur moyenne de l’ensemble de données. Il est calculé comme suit :

Moyenne = Σx i / n

où:

  • Σ : Un symbole qui signifie « somme »
  • x i : La i ème observation dans un ensemble de données
  • n : le nombre total d’observations dans l’ensemble de données

La médiane représente la valeur médiane d’un ensemble de données. Il est calculé en classant toutes les observations dans un ensemble de données de la plus petite à la plus grande, puis en identifiant la valeur médiane.

Par exemple, supposons que nous ayons l’ensemble de données suivant avec 11 observations :

Ensemble de données : 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

La moyenne de l’ensemble de données est calculée comme suit :

Moyenne = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9,54

La médiane de l’ensemble de données est la valeur directement au milieu, qui s’avère être 8 :

3, 4, 4, 6, 7 , 8, 12, 13, 15, 16, 17

L’estimation moyenne et médiane de l’endroit où se trouve le centre d’un ensemble de données. Cependant, selon la nature des données, la moyenne ou la médiane peut être plus utile pour décrire le centre de l’ensemble de données.

Quand utiliser la moyenne

Il est préférable d’utiliser la moyenne pour décrire le centre d’un ensemble de données lorsque la distribution est essentiellement symétrique et qu’il n’y a pas de valeurs aberrantes.

Par exemple, supposons que nous ayons la distribution suivante qui montre les salaires des habitants d’une certaine ville :

Étant donné que cette distribution est assez symétrique (si vous la divisez au milieu, chaque moitié semblerait à peu près égale) et qu’il n’y a pas de valeurs aberrantes, nous pouvons utiliser la moyenne pour décrire le centre de cet ensemble de données.

La moyenne s’avère être de 63 000 $, qui se situe approximativement au centre de la distribution :

Quand utiliser la médiane

Il est préférable d’utiliser la médiane lorsque la distribution est asymétrique ou lorsqu’il existe des valeurs aberrantes.

Données faussées :

Lorsqu’une distribution est asymétrique, la médiane décrit mieux le centre de la distribution que la moyenne.

Par exemple, considérons la répartition suivante des salaires des résidents d’une certaine ville :

La médiane rend mieux compte du salaire « typique » d’un résident que la moyenne. En effet, les valeurs élevées à l’extrémité de la distribution ont tendance à éloigner la moyenne du centre et vers la longue queue.

Dans cet exemple, la moyenne nous indique qu’un individu typique gagne environ 47 000 $ par an, tandis que la médiane nous indique que l’individu typique ne gagne qu’environ 32 000 $ par an, ce qui est beaucoup plus représentatif de l’individu type.

Valeurs aberrantes :

La médiane permet également de mieux capturer l’emplacement central d’une distribution lorsqu’il existe des valeurs aberrantes dans les données. Par exemple, considérons le graphique suivant qui montre la superficie en pieds carrés des maisons dans une certaine rue :

Quand utiliser la moyenne par rapport à la médiane

La moyenne est fortement influencée par quelques maisons extrêmement grandes, alors que la médiane ne l’est pas. Ainsi, la médiane parvient mieux à capturer la superficie « typique » d’une maison dans cette rue que la moyenne.

Résumé

En résumé:

  • La moyenne et la médiane peuvent être utilisées pour décrire où se trouve le « centre » d’un ensemble de données.
  • Il est préférable d’utiliser la moyenne lorsque la distribution des valeurs des données est symétrique et qu’il n’y a pas de valeurs aberrantes claires.
  • Il est préférable d’utiliser la médiane lorsque la distribution des valeurs des données est asymétrique ou lorsqu’il existe des valeurs aberrantes évidentes.

Ressources additionnelles

Comment les valeurs aberrantes affectent-elles la moyenne ?
Comment estimer la moyenne et la médiane de n’importe quel histogramme
Comment trouver la moyenne et la médiane des parcelles à tiges et à feuilles

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *