Як обчислити умовне середнє в pandas (з прикладами)


Ви можете використовувати наступний синтаксис для обчислення умовного середнього в пандах:

 df. loc [df[' team '] == ' A ', ' points ']. mean ()

Це обчислює середнє значення стовпця «очки» для кожного рядка в DataFrame, де стовпець «команда» дорівнює «A».

Наступні приклади показують, як використовувати цей синтаксис на практиці з наступними pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [99, 90, 93, 86, 88, 82],
                   ' assists ': [33, 28, 31, 39, 34, 30]})

#view DataFrame
print (df)

  team points assists
0 to 99 33
1 A 90 28
2 A 93 31
3 B 86 39
4 B 88 34
5 B 82 30

Приклад 1: обчислення умовного середнього для категоріальної змінної

У наступному коді показано, як обчислити середнє значення стовпця «очки» лише для рядків у DataFrame, де стовпець «команда» має значення «А».

 #calculate mean of 'points' column for rows where team equals 'A'
df. loc [df[' team '] == ' A ', ' points ']. mean ()

94.0

Середнє значення в стовпці «бали» для рядків, де «команда» дорівнює «А», становить 94 .

Ми можемо перевірити це вручну, усереднивши значення балів лише для рядків, де «команда» дорівнює «А»:

  • Середні бали: (99 + 90 + 93) / 3 = 94

Приклад 2: обчислення умовного середнього для числової змінної

У наведеному нижче коді показано, як обчислити середнє значення стовпця «допомога» лише для рядків у DataFrame, де значення стовпця «очки» більше або дорівнює 90.

 #calculate mean of 'assists' column for rows where 'points' >= 90
df. loc [df[' points '] >= 90 , ' assists ']. mean ()

30.666666666666668

Середнє значення в стовпці «допомоги» для рядків, де «очки» більше або дорівнює 90, становить 30,66667 .

Ми можемо перевірити це вручну, усереднивши значення балів лише для рядків, де «команда» дорівнює «А»:

  • Середня кількість передач: (33 + 28 + 31) / 3 = 30,66667

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Як обчислити середнє значення стовпців у Pandas
Як обчислити ковзне середнє в Pandas
Як заповнити значення NaN середнім у pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *