Как рассчитать точечные оценки в r (с примерами)
Точечная оценка представляет собой число, которое мы рассчитываем на основе выборочных данных для оценки параметра совокупности. Это наша наилучшая возможная оценка того, каким может быть истинный параметр популяции.
В следующей таблице показана точечная оценка, которую мы используем для оценки параметров популяции:
Мера | Параметр населения | Точечная оценка |
---|---|---|
Иметь в виду | μ (среднее значение численности населения) | x (выборочное среднее) |
Пропорция | π (доля населения) | p (доля выборки) |
Следующие примеры демонстрируют, как рассчитать точечные оценки среднего значения численности населения и доли населения в R.
Пример 1: Точечная оценка среднего значения генеральной совокупности
Допустим, мы хотим оценить среднюю высоту (в дюймах) определенного типа растения на определенном поле. Мы собираем простую случайную выборку из 13 растений и измеряем высоту каждого растения.
Следующий код показывает, как вычислить выборочное среднее значение:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
Средний показатель по выборке составляет 15,6 дюйма. Это представляет собой нашу точечную оценку среднего значения численности населения.
Мы также можем использовать следующий код для расчета 95% доверительного интервала для среднего значения совокупности:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
95% доверительный интервал для среднего значения генеральной совокупности составляет [12,0, 19,2] дюймов.
Пример 2: Точечная оценка доли населения
Предположим, мы хотим оценить долю жителей определенного города, поддерживающих определенный закон. Мы опрашиваем простую случайную выборку из 20 граждан.
Следующий код показывает, как рассчитать долю выборки:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
Доля выборки граждан, поддерживающих закон, составляет 0,6 . Это представляет собой нашу точечную оценку доли населения.
Мы также можем использовать следующий код для расчета 95% доверительного интервала для среднего значения совокупности:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
95% доверительный интервал для доли населения составляет [0,39, 0,81] .
Дополнительные ресурсы
Как посчитать сумму пяти чисел в R
Как найти доверительные интервалы в R
Как построить доверительный интервал в R