Як обчислити стандартну помилку середнього в r
Стандартна помилка середнього — це спосіб вимірювання розподілу значень у наборі даних. Він розраховується таким чином:
Стандартна похибка = s / √n
золото:
- s : вибіркове стандартне відхилення
- n : розмір вибірки
У цьому підручнику пояснюється два методи, які можна використовувати для обчислення стандартної помилки набору даних у R.
Спосіб 1. Використовуйте бібліотеку Plotrix
Перший спосіб обчислення стандартної похибки середнього — це використання вбудованої функції std.error() бібліотеки Plotrix.
Наступний код показує, як використовувати цю функцію:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Стандартна помилка середнього виявляється 2,001447 .
Спосіб 2: Визначте власну функцію
Інший спосіб обчислення стандартної похибки середнього значення набору даних — просто визначити власну функцію.
Наступний код показує, як це зробити:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Знову стандартна помилка середнього виявляється 2,0014 .
Як інтерпретувати стандартну помилку середнього
Стандартна помилка середнього — це просто міра розкиду значень навколо середнього.
Інтерпретуючи стандартну помилку середнього, слід пам’ятати про дві речі:
1. Чим більша стандартна помилка середнього значення, тим більше розкидані значення навколо середнього в наборі даних.
Щоб проілюструвати це, розглянемо, якщо ми змінимо останнє значення попереднього набору даних на набагато більше число:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Зверніть увагу, як стандартна помилка зростає з 2,001447 до 6,978265 .
Це вказує на те, що значення в цьому наборі даних більше розподілені навколо середнього порівняно з попереднім набором даних.
2. Зі збільшенням розміру вибірки стандартна помилка середнього має тенденцію до зменшення.
Щоб проілюструвати це, розглянемо стандартну помилку середнього для наступних двох наборів даних:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
Другий набір даних — це просто перший набір даних, повторений двічі.
Отже, обидва набори даних мають однакове середнє значення, але другий набір даних має більший розмір вибірки і, отже, має меншу стандартну помилку.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в R:
Як обчислити дисперсію вибірки та сукупності в R
Як обчислити загальну дисперсію в R
Як розрахувати коефіцієнт варіації R