Asymétrie et aplatissement
Cet article explique ce qu’est l’asymétrie et ce qu’est l’aplatissement dans les statistiques. Ainsi, vous trouverez la définition de ces deux concepts, comment calculer l’asymétrie et l’aplatissement, quelles sont leurs formules, ainsi qu’un calculateur en ligne pour calculer l’asymétrie et l’aplatissement de n’importe quel échantillon de données.
Que sont l’asymétrie et l’aplatissement ?
L’asymétrie et l’aplatissement sont deux mesures statistiques utilisées pour décrire la forme d’une distribution sans avoir à la représenter graphiquement. Plus précisément, l’asymétrie indique le degré de symétrie (ou asymétrie) d’une distribution, tandis que l’aplatissement indique le degré de concentration d’une distribution autour de sa moyenne.
En statistiques, l’asymétrie et l’aplatissement sont également appelés mesures de forme .
👉 Vous pouvez utiliser le calculateur en ligne ci-dessous pour calculer l’asymétrie et l’aplatissement de n’importe quel ensemble de données.
Asymétrie
En statistique, l’asymétrie est une mesure qui indique le degré de symétrie (ou asymétrie) d’une distribution par rapport à sa moyenne. Autrement dit, l’asymétrie est un paramètre statistique utilisé pour déterminer le degré de symétrie (ou d’asymétrie) d’une distribution sans qu’il soit nécessaire de la représenter graphiquement.
Ainsi, une distribution asymétrique est une distribution qui a un nombre de valeurs différent à gauche de la moyenne par rapport à a à sa droite. En revanche, dans une distribution symétrique il y a le même nombre de valeurs à gauche et à droite de la moyenne.
Ainsi, on distingue trois types d’asymétrie :
- Asymétrie positive : La distribution a plus de valeurs différentes à droite de la moyenne qu’à sa gauche.
- Symétrie : La distribution a le même nombre de valeurs à gauche de la moyenne qu’à droite de la moyenne.
- Asymétrie négative : La distribution a plus de valeurs différentes à gauche de la moyenne qu’à sa droite.
coefficient d’asymétrie
Le coefficient d’asymétrie , ou indice d’asymétrie , est un coefficient statistique qui permet de déterminer l’asymétrie d’une distribution. Ainsi, en calculant le coefficient d’asymétrie, il est possible de connaître quel type d’asymétrie présente la distribution sans avoir à la représenter graphiquement.
Bien qu’il existe différentes formules pour calculer le coefficient d’asymétrie, et nous les verrons toutes ci-dessous, quelle que soit la formule utilisée, l’interprétation du coefficient d’asymétrie se fait toujours comme suit :
- Si le coefficient d’asymétrie de est positif, la distribution est positivement asymétrique .
- Si le coefficient d’asymétrie de est égal à zéro, la distribution est symétrique .
- Si le coefficient d’asymétrie de est négatif, la distribution est asymétrique négativement .
Coefficient d’asymétrie de Fisher
Le coefficient d’asymétrie de Fisher est égal au troisième moment autour de la moyenne divisé par l’écart type de l’échantillon. Par conséquent, la formule du coefficient d’asymétrie de Fisher est la suivante :
De manière équivalente, l’une ou l’autre des deux formules suivantes peut être utilisée pour calculer le coefficient de Fisher :
Où
est l’espérance mathématique, la moyenne arithmétique, l’écart type et le nombre total de données.
En revanche, si les données sont regroupées vous pouvez utiliser la formule suivante :
Où dans ce cas
C’est la marque de la classe et la fréquence absolue du cours.
Coefficient d’asymétrie de Pearson
Le coefficient d’asymétrie de Pearson est égal à la différence entre la moyenne et le mode de l’échantillon divisée par son écart type (ou écart type). La formule du coefficient d’asymétrie de Pearson est donc la suivante :
Où
est le coefficient de Pearson, la moyenne arithmétique, la mode et l’écart type.
Gardez à l’esprit que le coefficient d’asymétrie de Pearson ne peut être calculé que s’il s’agit d’une distribution unimodale, c’est-à-dire s’il n’y a qu’un seul mode dans les données.
Coefficient d’asymétrie de Bowley
Le coefficient d’asymétrie de Bowley est égal à la somme du troisième quartile plus le premier quartile moins deux fois la médiane divisée par la différence entre le troisième et le premier quartile. La formule de ce coefficient d’asymétrie est donc la suivante :
Où
et Il s’agit respectivement du premier et du troisième quartile et est la médiane de la distribution.
Aplatissement
L’aplatissement , également appelé asymétrie , indique le degré de concentration d’une distribution autour de sa moyenne. Autrement dit, l’aplatissement indique si une distribution est raide ou plate. Plus précisément, plus l’aplatissement d’une distribution est élevé, plus elle est raide (ou pointue).
Il existe trois types d’aplatissement :
- Leptokurtique : la distribution est très pointue, c’est-à-dire que les données sont fortement concentrées autour de la moyenne. Plus précisément, les distributions leptokurtiques sont définies comme les distributions plus pointues que la distribution normale.
- Mésokurtique : L’aplatissement de la distribution est équivalent à l’aplatissement de la distribution normale. Par conséquent, il n’est ni considéré comme pointu ni aplati.
- Platykurtique : la distribution est très aplatie, c’est-à-dire que la concentration autour de la moyenne est faible. Formellement, les distributions platykurtiques sont définies comme les distributions qui sont plus plates que la distribution normale.
A noter que les différents types d’aplatissement sont définis en prenant comme référence l’aplatissement de la distribution normale.
coefficient d’aplatissement
La formule du coefficient d’aplatissement est la suivante :
La formule du coefficient d’aplatissement pour les données regroupées dans des tableaux de fréquence :
Enfin, la formule du coefficient d’aplatissement pour les données regroupées en intervalles :
Où:
- est le coefficient d’aplatissement.
- est le nombre total de données.
- est le ième point de données de la série.
- est la moyenne arithmétique de la distribution.
- est l’écart type (ou écart typique) de la distribution.
- est la fréquence absolue du ième ensemble de données.
- est la note de classe du i-ème groupe.
Notez que dans toutes les formules de coefficient d’aplatissement, 3 est soustrait car il s’agit de la valeur d’aplatissement de la distribution normale. Ainsi, le calcul du coefficient d’aplatissement se fait en prenant comme référence l’aplatissement de la distribution normale. C’est pourquoi parfois dans les statistiques, on dit qu’un kurtosis excessif est calculé.
Une fois le coefficient d’aplatissement calculé, il faut l’interpréter comme suit pour identifier de quel type d’aplatissement il s’agit :
- Si le coefficient d’aplatissement est positif, cela signifie que la distribution est leptokurtique .
- Si le coefficient d’aplatissement est égal à zéro, cela signifie que la distribution est mésokurtique .
- Si le coefficient d’aplatissement est négatif, cela signifie que la distribution est platykurtique .
Calculateur d’asymétrie et d’aplatissement
Entrez un ensemble de données dans la calculatrice suivante pour calculer son coefficient d’asymétrie et d’aplatissement et également déterminer de quel type de distribution il s’agit. Les données doivent être séparées par un espace et saisies en utilisant le point comme séparateur décimal.
A quoi servent l’asymétrie et l’aplatissement ?
Enfin, nous allons voir à quoi servent l’asymétrie et l’aplatissement en statistique et comment ces deux types de paramètres statistiques sont interprétés.
L’asymétrie et l’aplatissement servent à définir la forme d’une distribution de probabilité sans avoir besoin de la représenter graphiquement. Autrement dit, l’asymétrie et l’aplatissement sont calculés pour déterminer de quel type de distribution il s’agit sans qu’il soit nécessaire de la représenter graphiquement, ce qui prend généralement beaucoup de temps et d’efforts.
De plus, les valeurs d’asymétrie et d’aplatissement sont utilisées pour comparer la courbe d’une distribution avec une distribution normale. Car s’ils sont similaires, cela signifie que la distribution à étudier peut être approchée d’une distribution normale et, par conséquent, plusieurs théorèmes statistiques peuvent être appliqués.