Comment calculer l’écart type pondéré en Python
L’ écart type pondéré est un moyen utile de mesurer la dispersion des valeurs dans un ensemble de données lorsque certaines valeurs de l’ensemble de données ont des poids plus élevés que d’autres.
La formule pour calculer un écart type pondéré est la suivante :
où:
- N : Le nombre total d’ observations
- M : Le nombre de poids non nuls
- w i : Un vecteur de poids
- x i : Un vecteur de valeurs de données
- x : La moyenne pondérée
Le moyen le plus simple de calculer un écart type pondéré en Python consiste à utiliser la fonction DescrStatsW() du package statsmodels :
DescrStatsW(values, weights=weights, ddof=1).std
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : écart type pondéré en Python
Supposons que nous ayons le tableau suivant de valeurs de données et les poids correspondants :
#define data values values = [14, 19, 22, 25, 29, 31, 31, 38, 40, 41] #define weights weights = [1, 1, 1.5, 2, 2, 1.5, 1, 2, 3, 2]
Le code suivant montre comment calculer l’écart type pondéré pour ce tableau de valeurs de données :
from statsmodels.stats.weightstats import DescrStatsW
#calculate weighted standard deviation
DescrStatsW(values, weights=weights, ddof=1).std
8.570050878426773
L’écart type pondéré s’avère être de 8,57 .
Notez que nous pouvons également utiliser var pour calculer rapidement la variance pondérée :
from statsmodels.stats.weightstats import DescrStatsW
#calculate weighted variance
DescrStatsW(values, weights=weights, ddof=1).var
73.44577205882352
La variance pondérée s’avère être de 73,446 .
Ressources additionnelles
Les didacticiels suivants expliquent comment calculer l’écart type pondéré dans d’autres logiciels statistiques :
Comment calculer l’écart type pondéré dans Excel
Comment calculer l’écart type pondéré dans R