Як обчислити скорочене середнє в r (з прикладами)


Урізане середнє – це середнє значення набору даних, яке було обчислено після видалення певного відсотка найменшого та найбільшого значень у наборі даних.

Наприклад, 10% скорочене середнє представлятиме середнє значення набору даних після видалення найменших 10% значень і найбільших 10% значень.

Найпростіший спосіб обчислити скорочене середнє в R – це використовувати такий базовий синтаксис:

 #calculate 10% trimmed mean
mean(x, trim= 0.1 )

У наведених нижче прикладах показано, як використовувати цю функцію для обчислення скороченого середнього на практиці.

Приклад 1: обчислення скороченого середнього вектора

У наступному коді показано, як обчислити 10% скорочене середнє для вектора даних:

 #define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim= 0.1 )

[1] 12,375

10% скорочене середнє становить 12,375 .

Це середнє значення набору даних після того, як найменші 10% і найбільші 10% значень були видалені з набору даних.

Приклад 2: обчисліть скорочене середнє значення стовпця у кадрі даних

У наведеному нижче коді показано, як обчислити скорочене середнє значення на 5% для певного стовпця у кадрі даних:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim= 0.05 )

[1] 20.25

5% скорочене середнє значення в стовпці «бали» становить 20,25 .

Це середнє значення стовпця «бали» після видалення 5% найменших і 5% найбільших значень.

Приклад 3: обчисліть скорочене середнє для кількох стовпців

У наведеному нижче коді показано, як обчислити скорочене середнє значення на 5% для кількох стовпців у кадрі даних:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 ))

 assist points 
  20.25 7.75 

З результату ми бачимо:

  • 5% скорочене середнє значення стовпця «бали» становить 20,25 .
  • 5% скорочене середнє значення стовпця «допомоги» становить 7,75 .

Пов’язане: посібник із apply(), lapply(), sapply() і tapply() у R

Додаткові ресурси

У наступних посібниках надається додаткова інформація про скорочені середні значення:

Як вручну обчислити скорочене середнє
Як обчислити зрізане середнє в Python
Урізаний калькулятор середнього значення

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *