Как вычислить усеченное среднее значение в r (с примерами)


Обрезанное среднее значение — это среднее значение набора данных, которое было рассчитано после удаления определенного процента наименьших и наибольших значений в наборе данных.

Например, усеченное среднее значение, равное 10 %, будет представлять собой среднее значение набора данных после удаления 10 % наименьших и 10 % значений наибольшего значения.

Самый простой способ вычислить усеченное среднее значение в R — использовать следующий базовый синтаксис:

 #calculate 10% trimmed mean
mean(x, trim= 0.1 )

Следующие примеры показывают, как использовать эту функцию для расчета усеченного среднего на практике.

Пример 1. Вычисление усеченного среднего вектора

Следующий код показывает, как вычислить усеченное на 10% среднее значение для вектора данных:

 #define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim= 0.1 )

[1] 12,375

Среднее значение, усеченное на 10 %, составляет 12,375 .

Это среднее значение набора данных после того, как из набора данных были удалены наименьшие 10% и самые большие 10% значений.

Пример 2. Вычисление усеченного среднего значения столбца во фрейме данных.

Следующий код показывает, как вычислить усеченное среднее значение на 5 % для определенного столбца во фрейме данных:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim= 0.05 )

[1] 20.25

5%-ное усеченное среднее значений в столбце «пункты» составляет 20,25 .

Это среднее значение столбца «точек» после удаления 5 % наименьшего и 5 % наибольшего значений.

Пример 3. Вычисление усеченного среднего значения нескольких столбцов

Следующий код показывает, как вычислить усеченное среднее значение на 5 % для нескольких столбцов во фрейме данных:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 ))

 assist points 
  20.25 7.75 

По результату мы видим:

  • Усеченное на 5% среднее значение столбца «пункты» составляет 20,25 .
  • Усеченное на 5% среднее значение столбца «передачи» составляет 7,75 .

Связанный: Руководство по применению(), lapply(), sapply() и Tapply() в R.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация об усеченных средних значениях:

Как вручную вычислить усеченное среднее
Как вычислить усеченное среднее значение в Python
Калькулятор усеченного среднего

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *