Как рассчитать стандартную ошибку среднего значения в r

К бенджамин андерсон 27 июля, 2023 Гид 0 комментариев

Стандартная ошибка среднего — это способ измерения распределения значений в наборе данных. Он рассчитывается следующим образом:

Стандартная ошибка = s / √n

Золото:

s : выборочное стандартное отклонение
n : размер выборки

В этом руководстве объясняются два метода, которые можно использовать для расчета стандартной ошибки набора данных в R.

Способ 1. Используйте библиотеку Plotrix.

Первый способ вычислить стандартную ошибку среднего значения — использовать встроенную функцию std.error() библиотеки Plotrix.

Следующий код показывает, как использовать эту функцию:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Стандартная ошибка среднего значения равна 2,001447 .

Способ 2: Определите свою собственную функцию

Другой способ вычислить стандартную ошибку среднего значения набора данных — просто определить собственную функцию.

Следующий код показывает, как это сделать:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Опять же, стандартная ошибка среднего значения равна 2,0014 .

Как интерпретировать стандартную ошибку среднего значения

Стандартная ошибка среднего — это просто мера разброса значений вокруг среднего.

При интерпретации стандартной ошибки среднего значения следует иметь в виду две вещи:

1. Чем больше стандартная ошибка среднего, тем более разбросаны значения вокруг среднего в наборе данных.

Чтобы проиллюстрировать это, рассмотрим, изменим ли мы последнее значение предыдущего набора данных на гораздо большее число:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Обратите внимание, как стандартная ошибка увеличивается с 2,001447 до 6,978265 .

Это указывает на то, что значения в этом наборе данных больше распределены вокруг среднего значения по сравнению с предыдущим набором данных.

2. По мере увеличения размера выборки стандартная ошибка среднего имеет тенденцию к уменьшению.

Чтобы проиллюстрировать это, рассмотрим стандартную ошибку среднего значения для следующих двух наборов данных:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

Второй набор данных — это просто первый набор данных, повторенный дважды.

Таким образом, оба набора данных имеют одинаковое среднее значение, но второй набор данных имеет больший размер выборки и, следовательно, имеет меньшую стандартную ошибку.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как рассчитать дисперсию выборки и совокупности в R
Как рассчитать объединенную дисперсию в R
Как рассчитать коэффициент вариации R

Об авторе

бенджамин андерсон

Здравствуйте, я Бенджамин, профессор статистики на пенсии, ставший преданным преподавателем Statorials. Имея обширный опыт и знания в области статистики, я хочу поделиться своими знаниями, чтобы расширить возможности студентов с помощью Statorials. Узнать больше