Як розрахувати середньозважену величину в пандах


Ви можете використовувати таку функцію для обчислення середньозваженого значення в Pandas:

 def w_avg(df, values, weights):
    d = df[values]
    w = df[weights]
    return (d*w). sum () / w. sum ()

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: Середньозважений показник серед панд

Наступний код демонструє, як використовувати функцію зваженого середнього для обчислення зваженого середнього для даного набору даних, використовуючи «ціну» як значення та «кількість» як вагу:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' sales_rep ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' price ': [8, 5, 6, 7, 12, 14],
                   ' amount ': [1, 3, 2, 2, 5, 4]})

#view DataFrame
df

	sales_rep price amount
0 to 8 1
1 to 5 3
2 to 6 2
3 B 7 2
4 B 12 5
5 B 14 4

#find weighted average of price
w_avg(df, ' price ', ' amount ')

9.705882352941176

Середньозважене значення «ціни» виявляється рівним 9706 .

Приклад 2: Групування та середньозважене в Pandas

Наступний код показує, як використовувати функцію зваженого середнього для обчислення середньозваженого значення цін, згрупованих за продавцем:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' sales_rep ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' price ': [8, 5, 6, 7, 12, 14],
                   ' amount ': [1, 3, 2, 2, 5, 4]})

#find weighted average of price, grouped by sales rep
df. groupby (' sales_rep '). apply (w_avg, ' price ', ' amount ')

sales_rep
A 5.833333
B 11.818182
dtype:float64

Ми бачимо наступне:

  • Середньозважене значення «ціни» для продавця А становить 5833 .
  • Середньозважене значення ціни торгового представника B становить 11 818 .

Додаткові ресурси

Як порівняти два стовпці в Pandas
Як обчислити суму стовпців у Pandas
Як обчислити середнє значення стовпців у Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *