Як обчислити скорочене середнє в python (з прикладами)
Урізане середнє – це середнє значення набору даних, яке було обчислено після видалення певного відсотка найменшого та найбільшого значень у наборі даних.
Найпростіший спосіб обчислити скорочене середнє в Python — це використовувати функцію trim_mean() із бібліотеки SciPy.
Ця функція використовує такий базовий синтаксис:
from scipy import stats #calculate 10% trimmed mean stats. trim_mean (data, 0.1 )
У наведених нижче прикладах показано, як використовувати цю функцію для обчислення скороченого середнього на практиці.
Приклад 1: обчисліть скорочене середнє значення таблиці
Наступний код показує, як обчислити 10% скорочене середнє для таблиці даних:
from scipy import stats #define data data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12] #calculate 10% trimmed mean stats. trim_mean (data, 0.1 ) 12,375
10% скорочене середнє становить 12,375 .
Це середнє значення набору даних після того, як найменші 10% і найбільші 10% значень були видалені з набору даних.
Приклад 2: обчислення скороченого середнього значення стовпця в Pandas
Наступний код показує, як обчислити скорочене середнє значення на 5% для певного стовпця в pandas DataFrame:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of points stats. trim_mean (df. points , 0.05 ) 20.25
5% скорочене середнє значення в стовпці «бали» становить 20,25 .
Це середнє значення стовпця «бали» після видалення 5% найменших і 5% найбільших значень.
Приклад 3: обчисліть скорочене середнє для кількох стовпців
Наступний код показує, як обчислити 5% скорочене середнє для кількох стовпців у pandas DataFrame:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of 'points' and 'assists' columns stats. trim_mean (df[[' points ', ' assists ']], 0.05 ) array([20.25, 7.75])
З результату ми бачимо:
- 5% скорочене середнє значення стовпця «бали» становить 20,25 .
- 5% скорочене середнє значення стовпця «допомоги» становить 7,75 .
Примітка . Повну документацію щодо функції trim_mean() можна знайти тут .
Додаткові ресурси
Як вручну обчислити скорочене середнє
Урізаний калькулятор середнього значення