So berechnen sie einen kumulativen durchschnitt in python


Ein kumulativer Durchschnitt gibt uns den Durchschnitt einer Reihe von Werten bis zu einem bestimmten Punkt an.

Sie können die folgende Syntax verwenden, um den kumulativen Durchschnitt der Werte in einer Spalte eines Pandas-DataFrames zu berechnen:

 df[' column_name ']. expanding (). mean ()

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Berechnen Sie den kumulativen Durchschnitt in Python

Nehmen wir an, wir haben den folgenden Pandas-DataFrame, der die Gesamtverkäufe eines Geschäfts an 16 aufeinanderfolgenden Tagen anzeigt:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16],
                   ' sales ': [3, 6, 0, 2, 4, 1, 0, 1, 4, 7, 3, 3, 8, 3, 5, 5]})

#view first five rows of DataFrame
df. head ()

	day sales
0 1 3
1 2 6
2 3 0
3 4 2
4 5 4

Wir können die folgende Syntax verwenden, um den laufenden Durchschnitt der Verkaufsspalte zu berechnen:

 #calculate average of 'sales' column
df[' sales ']. expanding (). mean ()

0 3.000000
1 4.500000
2 3.000000
3 2.750000
4 3.000000
5 2.666667
6 2.285714
7 2.125000
8 2.333333
9 2.800000
10 2.818182
11 2.833333
12 3.230769
13 3.214286
14 3.333333
15 3.437500
Name: sales, dtype: float64

Die kumulierten Durchschnittswerte würden wir wie folgt interpretieren:

  • Der kumulierte Durchschnitt des Werts der Erstverkäufe beträgt 3 .
  • Der kumulierte Durchschnitt der ersten beiden Verkaufswerte beträgt 4,5 .
  • Der kumulierte Durchschnitt der ersten drei Verkaufswerte beträgt 3 .
  • Der kumulierte Durchschnitt der ersten vier Verkaufswerte beträgt 2,75 .

Und so weiter.

Beachten Sie, dass Sie auch den folgenden Code verwenden können, um die kumulierten Durchschnittsverkaufswerte als neue Spalte im DataFrame hinzuzufügen:

 #add cumulative average sales as new column
df[' cum_avg_sales '] = df[' sales ']. expanding (). mean ()

#view updated DataFrame
df

	day sales cum_avg_sales
0 1 3 3.000000
1 2 6 4.500000
2 3 0 3.000000
3 4 2 2.750000
4 5 4 3.000000
5 6 1 2.666667
6 7 0 2.285714
7 8 1 2.125000
8 9 4 2.333333
9 10 7 2.800000
10 11 3 2.818182
11 12 3 2.833333
12 13 8 3.230769
13 14 3 3.214286
14 15 5 3.333333
15 16 5 3.437500

Die Spalte „cum_avg_sales“ zeigt den kumulierten Durchschnitt der Werte in der Spalte „Umsatz“ an.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere gängige Metriken in Python berechnen:

So berechnen Sie einen getrimmten Mittelwert in Python
So berechnen Sie den geometrischen Mittelwert in Python
So berechnen Sie gleitende Durchschnitte in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert