Як обчислити стандартне відхилення в r (з прикладами)
Щоб обчислити стандартне відхилення вектора в R, можна використати такий синтаксис:
sd(x)
Зауважте, що ця формула обчислює стандартне відхилення вибірки за такою формулою:
√ Σ (x i – μ) 2 / (n-1)
золото:
- Σ : химерний символ, що означає «сума»
- x i : i-те значення набору даних
- μ : середнє значення набору даних
- n: розмір вибірки
Наступні приклади показують, як використовувати цю функцію на практиці.
Приклад 1: обчисліть стандартне відхилення вектора
Наступний код показує, як обчислити стандартне відхилення одного вектора в R:
#create dataset data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23) #find standard deviation sd(data) [1] 8.279157
Зауважте, що ви повинні використовувати na.rm = TRUE для обчислення стандартного відхилення, якщо в наборі даних відсутні значення:
#create dataset with missing values data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23) #attempt to find standard deviation sd(data) [1] NA #find standard deviation and specify to ignore missing values sd(data, na. rm = TRUE ) [1] 9.179753
Приклад 2: обчисліть стандартне відхилення стовпця у кадрі даних
У наступному коді показано, як обчислити стандартне відхилення окремого стовпця в кадрі даних:
#create data frame data <- data. frame (a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #find standard deviation of column a sd(data$a) [1] 3.060501
Приклад 3: обчисліть стандартне відхилення кількох стовпців у кадрі даних
У наступному коді показано, як обчислити стандартне відхилення кількох стовпців у кадрі даних:
#create data frame data <- data. frame (a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #find standard deviation of specific columns in data frame apply(data[, c(' a ', ' c ', ' d ')], 2, sd) acd 3.060501 4.289522 9.544632
Додаткові ресурси
Як знайти діапазон у R
Як обчислити дисперсію вибірки та сукупності в R
Як видалити викиди в R