Как рассчитать стандартную ошибку среднего значения в r
Стандартная ошибка среднего — это способ измерения распределения значений в наборе данных. Он рассчитывается следующим образом:
Стандартная ошибка = s / √n
Золото:
- s : выборочное стандартное отклонение
- n : размер выборки
В этом руководстве объясняются два метода, которые можно использовать для расчета стандартной ошибки набора данных в R.
Способ 1. Используйте библиотеку Plotrix.
Первый способ вычислить стандартную ошибку среднего значения — использовать встроенную функцию std.error() библиотеки Plotrix.
Следующий код показывает, как использовать эту функцию:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Стандартная ошибка среднего значения равна 2,001447 .
Способ 2: Определите свою собственную функцию
Другой способ вычислить стандартную ошибку среднего значения набора данных — просто определить собственную функцию.
Следующий код показывает, как это сделать:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Опять же, стандартная ошибка среднего значения равна 2,0014 .
Как интерпретировать стандартную ошибку среднего значения
Стандартная ошибка среднего — это просто мера разброса значений вокруг среднего.
При интерпретации стандартной ошибки среднего значения следует иметь в виду две вещи:
1. Чем больше стандартная ошибка среднего, тем более разбросаны значения вокруг среднего в наборе данных.
Чтобы проиллюстрировать это, рассмотрим, изменим ли мы последнее значение предыдущего набора данных на гораздо большее число:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Обратите внимание, как стандартная ошибка увеличивается с 2,001447 до 6,978265 .
Это указывает на то, что значения в этом наборе данных больше распределены вокруг среднего значения по сравнению с предыдущим набором данных.
2. По мере увеличения размера выборки стандартная ошибка среднего имеет тенденцию к уменьшению.
Чтобы проиллюстрировать это, рассмотрим стандартную ошибку среднего значения для следующих двух наборов данных:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
Второй набор данных — это просто первый набор данных, повторенный дважды.
Таким образом, оба набора данных имеют одинаковое среднее значение, но второй набор данных имеет больший размер выборки и, следовательно, имеет меньшую стандартную ошибку.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как рассчитать дисперсию выборки и совокупности в R
Как рассчитать объединенную дисперсию в R
Как рассчитать коэффициент вариации R