Як обчислити стандартну помилку середнього в r


Стандартна помилка середнього — це спосіб вимірювання розподілу значень у наборі даних. Він розраховується таким чином:

Стандартна похибка = s / √n

золото:

  • s : вибіркове стандартне відхилення
  • n : розмір вибірки

У цьому підручнику пояснюється два методи, які можна використовувати для обчислення стандартної помилки набору даних у R.

Спосіб 1. Використовуйте бібліотеку Plotrix

Перший спосіб обчислення стандартної похибки середнього — це використання вбудованої функції std.error() бібліотеки Plotrix.

Наступний код показує, як використовувати цю функцію:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Стандартна помилка середнього виявляється 2,001447 .

Спосіб 2: Визначте власну функцію

Інший спосіб обчислення стандартної похибки середнього значення набору даних — просто визначити власну функцію.

Наступний код показує, як це зробити:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Знову стандартна помилка середнього виявляється 2,0014 .

Як інтерпретувати стандартну помилку середнього

Стандартна помилка середнього — це просто міра розкиду значень навколо середнього.

Інтерпретуючи стандартну помилку середнього, слід пам’ятати про дві речі:

1. Чим більша стандартна помилка середнього значення, тим більше розкидані значення навколо середнього в наборі даних.

Щоб проілюструвати це, розглянемо, якщо ми змінимо останнє значення попереднього набору даних на набагато більше число:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Зверніть увагу, як стандартна помилка зростає з 2,001447 до 6,978265 .

Це вказує на те, що значення в цьому наборі даних більше розподілені навколо середнього порівняно з попереднім набором даних.

2. Зі збільшенням розміру вибірки стандартна помилка середнього має тенденцію до зменшення.

Щоб проілюструвати це, розглянемо стандартну помилку середнього для наступних двох наборів даних:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

Другий набір даних — це просто перший набір даних, повторений двічі.

Отже, обидва набори даних мають однакове середнє значення, але другий набір даних має більший розмір вибірки і, отже, має меншу стандартну помилку.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як обчислити дисперсію вибірки та сукупності в R
Як обчислити загальну дисперсію в R
Як розрахувати коефіцієнт варіації R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *