Comment calculer l’asymétrie & Aplatissement en Python
En statistiques, l’asymétrie et l’aplatissement sont deux façons de mesurer la forme d’une distribution.
L’asymétrie est une mesure de l’asymétrie d’une distribution. Cette valeur peut être positive ou négative.
- Une asymétrie négative indique que la queue se trouve sur le côté gauche de la distribution, qui s’étend vers des valeurs plus négatives.
- Une asymétrie positive indique que la queue se trouve du côté droit de la distribution, qui s’étend vers des valeurs plus positives.
- Une valeur de zéro indique qu’il n’y a aucune asymétrie dans la distribution, ce qui signifie que la distribution est parfaitement symétrique.
L’aplatissement est une mesure permettant de savoir si une distribution est à queue lourde ou légère par rapport à unedistribution normale .
- L’aplatissement d’une distribution normale est de 3.
- Si une distribution donnée a un kurtosis inférieur à 3, elle est dite playkurtique , ce qui signifie qu’elle a tendance à produire moins de valeurs aberrantes et moins extrêmes que la distribution normale.
- Si une distribution donnée a un aplatissement supérieur à 3, elle est dite leptokurtique , ce qui signifie qu’elle a tendance à produire plus de valeurs aberrantes que la distribution normale.
Remarque : Certaines formules (définition de Fisher) soustraient 3 de l’aplatissement pour faciliter la comparaison avec la distribution normale. En utilisant cette définition, une distribution aurait un aplatissement supérieur à une distribution normale si elle avait une valeur d’aplatissement supérieure à 0.
Ce didacticiel explique comment calculer à la fois l’asymétrie et l’aplatissement d’un ensemble de données donné en Python.
Exemple : asymétrie et aplatissement en Python
Supposons que nous ayons l’ensemble de données suivant :
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]
Pour calculer l’asymétrie et l’aplatissement de l’échantillon de cet ensemble de données, nous pouvons utiliser les fonctions skew() et kurt() de la bibliothèque Scipy Stata avec la syntaxe suivante :
- biais (tableau de valeurs, biais = faux)
- kurt (tableau de valeurs, biais = faux)
Nous utilisons l’argument biais=Faux pour calculer l’asymétrie et l’aplatissement de l’échantillon par opposition à l’asymétrie et à l’aplatissement de la population.
Voici comment utiliser ces fonctions pour notre ensemble de données particulier :
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81] #calculate sample skewness skew(data, bias=False) 0.032697 #calculate sample kurtosis kurtosis(data, bias=False) 0.118157
L’asymétrie s’avère être de 0,032697 et l’aplatissement s’avère être de 0,118157 .
Cela signifie que la distribution est légèrement asymétrique positivement et qu’elle a plus de valeurs dans les queues par rapport à une distribution normale.
Ressource supplémentaire : Calculateur d’asymétrie et d’aplatissement
Vous pouvez également calculer l’asymétrie pour un ensemble de données donné à l’aide du calculateur d’asymétrie et d’aplatissement statistique , qui calcule automatiquement l’asymétrie et l’aplatissement pour un ensemble de données donné.