Как вычислить усеченное среднее значение в r (с примерами)
Обрезанное среднее значение — это среднее значение набора данных, которое было рассчитано после удаления определенного процента наименьших и наибольших значений в наборе данных.
Например, усеченное среднее значение, равное 10 %, будет представлять собой среднее значение набора данных после удаления 10 % наименьших и 10 % значений наибольшего значения.
Самый простой способ вычислить усеченное среднее значение в R — использовать следующий базовый синтаксис:
#calculate 10% trimmed mean mean(x, trim= 0.1 )
Следующие примеры показывают, как использовать эту функцию для расчета усеченного среднего на практике.
Пример 1. Вычисление усеченного среднего вектора
Следующий код показывает, как вычислить усеченное на 10% среднее значение для вектора данных:
#define data data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12) #calculate 10% trimmed mean mean(data, trim= 0.1 ) [1] 12,375
Среднее значение, усеченное на 10 %, составляет 12,375 .
Это среднее значение набора данных после того, как из набора данных были удалены наименьшие 10% и самые большие 10% значений.
Пример 2. Вычисление усеченного среднего значения столбца во фрейме данных.
Следующий код показывает, как вычислить усеченное среднее значение на 5 % для определенного столбца во фрейме данных:
#create data frame df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points mean(df$points, trim= 0.05 ) [1] 20.25
5%-ное усеченное среднее значений в столбце «пункты» составляет 20,25 .
Это среднее значение столбца «точек» после удаления 5 % наименьшего и 5 % наибольшего значений.
Пример 3. Вычисление усеченного среднего значения нескольких столбцов
Следующий код показывает, как вычислить усеченное среднее значение на 5 % для нескольких столбцов во фрейме данных:
#create data frame df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points and assists sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 )) assist points 20.25 7.75
По результату мы видим:
- Усеченное на 5% среднее значение столбца «пункты» составляет 20,25 .
- Усеченное на 5% среднее значение столбца «передачи» составляет 7,75 .
Связанный: Руководство по применению(), lapply(), sapply() и Tapply() в R.
Дополнительные ресурсы
В следующих руководствах представлена дополнительная информация об усеченных средних значениях:
Как вручную вычислить усеченное среднее
Как вычислить усеченное среднее значение в Python
Калькулятор усеченного среднего