Как рассчитать точечные оценки в r (с примерами)


Точечная оценка представляет собой число, которое мы рассчитываем на основе выборочных данных для оценки параметра совокупности. Это наша наилучшая возможная оценка того, каким может быть истинный параметр популяции.

В следующей таблице показана точечная оценка, которую мы используем для оценки параметров популяции:

Мера Параметр населения Точечная оценка
Иметь в виду μ (среднее значение численности населения) x (выборочное среднее)
Пропорция π (доля населения) p (доля выборки)

Следующие примеры демонстрируют, как рассчитать точечные оценки среднего значения численности населения и доли населения в R.

Пример 1: Точечная оценка среднего значения генеральной совокупности

Допустим, мы хотим оценить среднюю высоту (в дюймах) определенного типа растения на определенном поле. Мы собираем простую случайную выборку из 13 растений и измеряем высоту каждого растения.

Следующий код показывает, как вычислить выборочное среднее значение:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

Средний показатель по выборке составляет 15,6 дюйма. Это представляет собой нашу точечную оценку среднего значения численности населения.

Мы также можем использовать следующий код для расчета 95% доверительного интервала для среднего значения совокупности:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

95% доверительный интервал для среднего значения генеральной совокупности составляет [12,0, 19,2] дюймов.

Пример 2: Точечная оценка доли населения

Предположим, мы хотим оценить долю жителей определенного города, поддерживающих определенный закон. Мы опрашиваем простую случайную выборку из 20 граждан.

Следующий код показывает, как рассчитать долю выборки:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

Доля выборки граждан, поддерживающих закон, составляет 0,6 . Это представляет собой нашу точечную оценку доли населения.

Мы также можем использовать следующий код для расчета 95% доверительного интервала для среднего значения совокупности:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

95% доверительный интервал для доли населения составляет [0,39, 0,81] .

Дополнительные ресурсы

Как посчитать сумму пяти чисел в R
Как найти доверительные интервалы в R
Как построить доверительный интервал в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *