Python에서 누적 평균을 계산하는 방법


누적 평균은 특정 지점까지 일련의 값의 평균을 알려줍니다.

다음 구문을 사용하여 Pandas DataFrame 열에 있는 값의 누적 평균을 계산할 수 있습니다.

 df[' column_name ']. expanding (). mean ()

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Python에서 누적 평균 계산

연속 16일 동안 매장에서 발생한 총 매출을 보여주는 다음과 같은 pandas DataFrame이 있다고 가정해 보겠습니다.

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16],
                   ' sales ': [3, 6, 0, 2, 4, 1, 0, 1, 4, 7, 3, 3, 8, 3, 5, 5]})

#view first five rows of DataFrame
df. head ()

	day sales
0 1 3
1 2 6
2 3 0
3 4 2
4 5 4

다음 구문을 사용하여 판매 열의 이동 평균을 계산할 수 있습니다.

 #calculate average of 'sales' column
df[' sales ']. expanding (). mean ()

0 3.000000
1 4.500000
2 3.000000
3 2.750000
4 3.000000
5 2.666667
6 2.285714
7 2.125000
8 2.333333
9 2.800000
10 2.818182
11 2.833333
12 3.230769
13 3.214286
14 3.333333
15 3.437500
Name: sales, dtype: float64

누적 평균값을 다음과 같이 해석합니다.

  • 첫 판매액의 누적 평균은 3 이다.
  • 처음 두 판매 값의 누적 평균은 4.5 입니다.
  • 처음 3개의 판매 값의 누적 평균은 3 입니다.
  • 처음 4개의 판매 값의 누적 평균은 2.75 입니다.

등등.

다음 코드를 사용하여 누적 평균 매출 값을 DataFrame의 새 열로 추가할 수도 있습니다.

 #add cumulative average sales as new column
df[' cum_avg_sales '] = df[' sales ']. expanding (). mean ()

#view updated DataFrame
df

	day sales cum_avg_sales
0 1 3 3.000000
1 2 6 4.500000
2 3 0 3.000000
3 4 2 2.750000
4 5 4 3.000000
5 6 1 2.666667
6 7 0 2.285714
7 8 1 2.125000
8 9 4 2.333333
9 10 7 2.800000
10 11 3 2.818182
11 12 3 2.833333
12 13 8 3.230769
13 14 3 3.214286
14 15 5 3.333333
15 16 5 3.437500

cum_avg_sales 열에는 “sales” 열 값의 누적 평균이 표시됩니다.

추가 리소스

다음 튜토리얼에서는 Python에서 다른 일반적인 측정항목을 계산하는 방법을 설명합니다.

Python에서 절사 평균을 계산하는 방법
Python에서 기하 평균을 계산하는 방법
Python에서 이동 평균을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다