如何在 r 中计算点估计(附示例)


点估计表示我们根据样本数据计算出的数字,以估计总体参数。这是我们对真实总体参数可能的最佳估计。

下表显示了我们用来估计总体参数的点估计:

的措施 人口参数 点估计
意思是 μ(总体平均值) x (样本平均值)
部分 π(人口比例) p(样本比例)

以下示例演示如何计算 R 中总体平均值和总体比例的点估计。

示例 1:总体平均值的点估计

假设我们想要估计特定田地中特定类型植物的平均高度(以英寸为单位)。我们收集了 13 株植物的简单随机样本,并测量了每株植物的高度。

以下代码展示了如何计算样本均值:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

样本平均值为15.6英寸。这代表了我们对总体平均值的点估计。

我们还可以使用以下代码来计算总体平均值的 95% 置信区间:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

总体平均值的 95% 置信区间为[12.0, 19.2]英寸。

示例2:人口比例的点估计

假设我们想要估计某个城市支持某项法律的人口比例。我们随机采访了 20 名公民。

下面的代码展示了如何计算样本比例:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

支持该法律的公民样本比例为0.6 。这代表了我们对人口比例的点估计。

我们还可以使用以下代码来计算总体平均值的 95% 置信区间:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

人口比例的 95% 置信区间为[0.39, 0.81]

其他资源

如何在R中计算五个数字的总和
如何在 R 中找到置信区间
如何在 R 中绘制置信区间

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注