统计在研究中的重要性(附示例)
统计学领域涉及数据的收集、分析、解释和呈现。
在研究中,统计数据很重要,原因如下:
原因 1 :统计学允许研究人员设计研究,以便研究结果可以外推到更大的人群。
原因 2 :统计数据允许研究人员进行假设检验,以确定有关新药、程序、制造方法等的某些主张是否成立。是有效的。是真的。
原因 3 :统计数据使研究人员能够创建置信区间,以捕捉人口估计的不确定性。
在本文的其余部分中,我们将逐一阐述这些原因。
原因 1:统计数据使研究人员能够设计研究
研究人员经常想回答有关人群的问题,例如:
- 某种鸟类的平均重量是多少?
- 某种植物种类的平均高度是多少?
- 某个城市有多少比例的公民支持某项法律?
回答这些问题的一种方法是收集感兴趣人群中每个人的数据。
然而,这通常成本过高且耗时,因此研究人员改为对总体进行抽样,并使用样本数据得出有关总体总体的结论。
研究人员可以使用许多不同的方法将个体纳入样本。这些方法称为抽样方法。
抽样方法有两类:
- 概率抽样方法:总体中的每个成员都有相同的概率被选为样本的一部分。
- 非概率抽样方法:并非总体中的所有成员都有相同的概率被选为样本的一部分。
通过使用概率抽样方法,研究人员可以最大限度地提高获得总体总体代表性样本的机会。
这使得研究人员能够将样本的结果推断到总体。
在此处了解有关两类采样方法的更多信息。
原因 2:统计数据使研究人员能够进行假设检验
统计学还以假设检验的形式用于研究。
研究人员可以使用这些测试来确定不同医疗程序或治疗之间是否存在统计显着性。
例如,假设一位科学家相信一种新药能够降低肥胖患者的血压。为了验证这一点,他测量了 30 名患者使用新药一个月前后的血压。
然后,它使用以下假设执行配对样本 t 检验:
- H 0 : μ后=μ前(用药前后平均血压相同)
- H A : μ后< μ前(使用药物后平均血压较低)
如果检验的p 值低于某个显着性水平(例如 α = 0.05),则可以拒绝原假设并得出新药导致血压降低的结论。
注意:这只是研究中使用的假设检验的一个例子。其他常见检验包括单样本 t 检验、双样本 t 检验、单向方差分析和双向方差分析。
原因 3:统计数据使研究人员能够创建置信区间
统计数据也以置信区间的形式用于研究。
置信区间是可能包含具有一定置信水平的总体参数的值范围。
例如,假设研究人员想要估计某种海龟的平均重量。
研究人员无需四处走动并称量种群中的每只海龟,而是可以使用以下信息对海龟进行简单的随机抽样:
- 样本量n = 25
- 平均样本重量x = 300
- 样本标准差s = 18.5
使用平均公式 的置信区间,研究人员可以构建以下 95% 置信区间:
95% 置信区间: 300 +/- 1.96*(18.5/√ 25 ) = [292.75, 307.25]
研究人员随后声称,他们 95% 确信该海龟种群的真实平均体重在 292.75 磅至 307.25 磅之间。
其他资源
以下文章解释了统计在其他领域的重要性: