如何在 r 中计算点估计(附示例)
点估计表示我们根据样本数据计算出的数字,以估计总体参数。这是我们对真实总体参数可能的最佳估计。
下表显示了我们用来估计总体参数的点估计:
的措施 | 人口参数 | 点估计 |
---|---|---|
意思是 | μ(总体平均值) | x (样本平均值) |
部分 | π(人口比例) | p(样本比例) |
以下示例演示如何计算 R 中总体平均值和总体比例的点估计。
示例 1:总体平均值的点估计
假设我们想要估计特定田地中特定类型植物的平均高度(以英寸为单位)。我们收集了 13 株植物的简单随机样本,并测量了每株植物的高度。
以下代码展示了如何计算样本均值:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
样本平均值为15.6英寸。这代表了我们对总体平均值的点估计。
我们还可以使用以下代码来计算总体平均值的 95% 置信区间:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
总体平均值的 95% 置信区间为[12.0, 19.2]英寸。
示例2:人口比例的点估计
假设我们想要估计某个城市支持某项法律的人口比例。我们随机采访了 20 名公民。
下面的代码展示了如何计算样本比例:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
支持该法律的公民样本比例为0.6 。这代表了我们对人口比例的点估计。
我们还可以使用以下代码来计算总体平均值的 95% 置信区间:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
人口比例的 95% 置信区间为[0.39, 0.81] 。