So berechnen sie einen kumulativen durchschnitt in python
Ein kumulativer Durchschnitt gibt uns den Durchschnitt einer Reihe von Werten bis zu einem bestimmten Punkt an.
Sie können die folgende Syntax verwenden, um den kumulativen Durchschnitt der Werte in einer Spalte eines Pandas-DataFrames zu berechnen:
df[' column_name ']. expanding (). mean ()
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Berechnen Sie den kumulativen Durchschnitt in Python
Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der die Gesamtverkäufe eines Geschäfts an 16 aufeinanderfolgenden Tagen anzeigt:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16], ' sales ': [3, 6, 0, 2, 4, 1, 0, 1, 4, 7, 3, 3, 8, 3, 5, 5]}) #view first five rows of DataFrame df. head () day sales 0 1 3 1 2 6 2 3 0 3 4 2 4 5 4
Wir können die folgende Syntax verwenden, um den laufenden Durchschnitt der Verkaufsspalte zu berechnen:
#calculate average of 'sales' column df[' sales ']. expanding (). mean () 0 3.000000 1 4.500000 2 3.000000 3 2.750000 4 3.000000 5 2.666667 6 2.285714 7 2.125000 8 2.333333 9 2.800000 10 2.818182 11 2.833333 12 3.230769 13 3.214286 14 3.333333 15 3.437500 Name: sales, dtype: float64
Die kumulierten Durchschnittswerte würden wir wie folgt interpretieren:
- Der kumulierte Durchschnitt des Werts der Erstverkäufe beträgt 3 .
- Der kumulierte Durchschnitt der ersten beiden Verkaufswerte beträgt 4,5 .
- Der kumulierte Durchschnitt der ersten drei Verkaufswerte beträgt 3 .
- Der kumulierte Durchschnitt der ersten vier Verkaufswerte beträgt 2,75 .
Und so weiter.
Beachten Sie, dass Sie auch den folgenden Code verwenden können, um die kumulierten Durchschnittsverkaufswerte als neue Spalte im DataFrame hinzuzufügen:
#add cumulative average sales as new column df[' cum_avg_sales '] = df[' sales ']. expanding (). mean () #view updated DataFrame df day sales cum_avg_sales 0 1 3 3.000000 1 2 6 4.500000 2 3 0 3.000000 3 4 2 2.750000 4 5 4 3.000000 5 6 1 2.666667 6 7 0 2.285714 7 8 1 2.125000 8 9 4 2.333333 9 10 7 2.800000 10 11 3 2.818182 11 12 3 2.833333 12 13 8 3.230769 13 14 3 3.214286 14 15 5 3.333333 15 16 5 3.437500
Die Spalte „cum_avg_sales“ zeigt den kumulierten Durchschnitt der Werte in der Spalte „Umsatz“ an.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere gängige Metriken in Python berechnen:
So berechnen Sie einen getrimmten Mittelwert in Python
So berechnen Sie den geometrischen Mittelwert in Python
So berechnen Sie gleitende Durchschnitte in Python