Як обчислити умовне середнє в pandas (з прикладами)
Ви можете використовувати наступний синтаксис для обчислення умовного середнього в пандах:
df. loc [df[' team '] == ' A ', ' points ']. mean ()
Це обчислює середнє значення стовпця «очки» для кожного рядка в DataFrame, де стовпець «команда» дорівнює «A».
Наступні приклади показують, як використовувати цей синтаксис на практиці з наступними pandas DataFrame:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
' points ': [99, 90, 93, 86, 88, 82],
' assists ': [33, 28, 31, 39, 34, 30]})
#view DataFrame
print (df)
team points assists
0 to 99 33
1 A 90 28
2 A 93 31
3 B 86 39
4 B 88 34
5 B 82 30
Приклад 1: обчислення умовного середнього для категоріальної змінної
У наступному коді показано, як обчислити середнє значення стовпця «очки» лише для рядків у DataFrame, де стовпець «команда» має значення «А».
#calculate mean of 'points' column for rows where team equals 'A'
df. loc [df[' team '] == ' A ', ' points ']. mean ()
94.0
Середнє значення в стовпці «бали» для рядків, де «команда» дорівнює «А», становить 94 .
Ми можемо перевірити це вручну, усереднивши значення балів лише для рядків, де «команда» дорівнює «А»:
- Середні бали: (99 + 90 + 93) / 3 = 94
Приклад 2: обчислення умовного середнього для числової змінної
У наведеному нижче коді показано, як обчислити середнє значення стовпця «допомога» лише для рядків у DataFrame, де значення стовпця «очки» більше або дорівнює 90.
#calculate mean of 'assists' column for rows where 'points' >= 90
df. loc [df[' points '] >= 90 , ' assists ']. mean ()
30.666666666666668
Середнє значення в стовпці «допомоги» для рядків, де «очки» більше або дорівнює 90, становить 30,66667 .
Ми можемо перевірити це вручну, усереднивши значення балів лише для рядків, де «команда» дорівнює «А»:
- Середня кількість передач: (33 + 28 + 31) / 3 = 30,66667
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:
Як обчислити середнє значення стовпців у Pandas
Як обчислити ковзне середнє в Pandas
Як заповнити значення NaN середнім у pandas