Як обчислити скорочене середнє в python (з прикладами)


Урізане середнє – це середнє значення набору даних, яке було обчислено після видалення певного відсотка найменшого та найбільшого значень у наборі даних.

Найпростіший спосіб обчислити скорочене середнє в Python — це використовувати функцію trim_mean() із бібліотеки SciPy.

Ця функція використовує такий базовий синтаксис:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

У наведених нижче прикладах показано, як використовувати цю функцію для обчислення скороченого середнього на практиці.

Приклад 1: обчисліть скорочене середнє значення таблиці

Наступний код показує, як обчислити 10% скорочене середнє для таблиці даних:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

10% скорочене середнє становить 12,375 .

Це середнє значення набору даних після того, як найменші 10% і найбільші 10% значень були видалені з набору даних.

Приклад 2: обчислення скороченого середнього значення стовпця в Pandas

Наступний код показує, як обчислити скорочене середнє значення на 5% для певного стовпця в pandas DataFrame:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

5% скорочене середнє значення в стовпці «бали» становить 20,25 .

Це середнє значення стовпця «бали» після видалення 5% найменших і 5% найбільших значень.

Приклад 3: обчисліть скорочене середнє для кількох стовпців

Наступний код показує, як обчислити 5% скорочене середнє для кількох стовпців у pandas DataFrame:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

З результату ми бачимо:

  • 5% скорочене середнє значення стовпця «бали» становить 20,25 .
  • 5% скорочене середнє значення стовпця «допомоги» становить 7,75 .

Примітка . Повну документацію щодо функції trim_mean() можна знайти тут .

Додаткові ресурси

Як вручну обчислити скорочене середнє
Урізаний калькулятор середнього значення

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *