Comment calculer l’écart type pondéré en Python



L’ écart type pondéré est un moyen utile de mesurer la dispersion des valeurs dans un ensemble de données lorsque certaines valeurs de l’ensemble de données ont des poids plus élevés que d’autres.

La formule pour calculer un écart type pondéré est la suivante :

où:

  • N : Le nombre total d’ observations
  • M : Le nombre de poids non nuls
  • w i : Un vecteur de poids
  • x i : Un vecteur de valeurs de données
  • x : La moyenne pondérée

Le moyen le plus simple de calculer un écart type pondéré en Python consiste à utiliser la fonction DescrStatsW() du package statsmodels :

DescrStatsW(values, weights=weights, ddof=1).std

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : écart type pondéré en Python

Supposons que nous ayons le tableau suivant de valeurs de données et les poids correspondants :

#define data values 
values = [14, 19, 22, 25, 29, 31, 31, 38, 40, 41]

#define weights
weights = [1, 1, 1.5, 2, 2, 1.5, 1, 2, 3, 2]

Le code suivant montre comment calculer l’écart type pondéré pour ce tableau de valeurs de données :

from statsmodels.stats.weightstats import DescrStatsW

#calculate weighted standard deviation
DescrStatsW(values, weights=weights, ddof=1).std

8.570050878426773

L’écart type pondéré s’avère être de 8,57 .

Notez que nous pouvons également utiliser var pour calculer rapidement la variance pondérée :

from statsmodels.stats.weightstats import DescrStatsW

#calculate weighted variance
DescrStatsW(values, weights=weights, ddof=1).var

73.44577205882352

La variance pondérée s’avère être de 73,446 .

Ressources additionnelles

Les didacticiels suivants expliquent comment calculer l’écart type pondéré dans d’autres logiciels statistiques :

Comment calculer l’écart type pondéré dans Excel
Comment calculer l’écart type pondéré dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *