So berechnen sie die gewichtete standardabweichung in python
Die gewichtete Standardabweichung ist eine nützliche Methode zur Messung der Streuung von Werten in einem Datensatz, wenn einige Werte im Datensatz höhere Gewichte haben als andere.
Die Formel zur Berechnung einer gewichteten Standardabweichung lautet:
Gold:
- N: Die Gesamtzahl der Beobachtungen
- M: Die Anzahl der Gewichte ungleich Null
- w i : Ein Gewichtsvektor
- x i : Ein Vektor von Datenwerten
- x : Der gewichtete Durchschnitt
Der einfachste Weg, eine gewichtete Standardabweichung in Python zu berechnen, ist die Verwendung der Funktion DescrStatsW() aus dem Paket statsmodels:
DescrStatsW(values, weights=weights, ddof= 1 ). std
Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel: Gewichtete Standardabweichung in Python
Angenommen, wir haben das folgende Array von Datenwerten und die entsprechenden Gewichte:
#define data values values = [14, 19, 22, 25, 29, 31, 31, 38, 40, 41] #define weights weights = [1, 1, 1.5, 2, 2, 1.5, 1, 2, 3, 2]
Der folgende Code zeigt, wie die gewichtete Standardabweichung für dieses Array von Datenwerten berechnet wird:
from statsmodels. stats . weightstats import DescrStatsW
#calculate weighted standard deviation
DescrStatsW(values, weights=weights, ddof= 1 ). std
8.570050878426773
Die gewichtete Standardabweichung beträgt 8,57 .
Beachten Sie, dass wir var auch verwenden können, um die gewichtete Varianz schnell zu berechnen:
from statsmodels. stats . weightstats import DescrStatsW
#calculate weighted variance
DescrStatsW(values, weights=weights, ddof= 1 ). var
73.44577205882352
Die gewichtete Varianz beträgt 73.446 .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie die gewichtete Standardabweichung in anderer Statistiksoftware berechnen:
So berechnen Sie die gewichtete Standardabweichung in Excel
So berechnen Sie die gewichtete Standardabweichung in R