P值对比阿尔法:有什么区别?
学生在统计学中经常混淆的两个术语是p 值和alpha 。
这两个术语都用于假设检验,这是我们用来拒绝或未能拒绝假设的正式统计检验。
例如,假设我们假设一种新药比目前的标准药更能降低患者的血压。
为了测试这一点,我们可以执行假设检验,其中定义以下原假设和备择假设:
零假设:新药丸和标准药丸没有区别。
替代假设:新药丸和标准药丸之间存在差异。
如果我们假设原假设为真,则检验的p 值会告诉我们获得至少与我们在样本数据中实际观察到的效果一样大的效果的概率。
例如,假设我们发现假设检验的 p 值为 0.02。
以下是如何解释这个 p 值:如果新药丸和标准药丸之间确实没有差异,那么我们运行此假设检验的 2% 次我们将得到在数据样本中观察到的效果,或更多,只是由于随机抽样误差。
这告诉我们,如果新药丸和标准药丸之间确实没有差异,那么获得我们实际所做的数据样本将是相当罕见的。
因此,我们倾向于拒绝零假设并得出结论:新药丸和标准药丸之间存在差异。
但是我们应该使用什么阈值来确定我们的 p 值是否足够低以拒绝零假设?
这就是阿尔法发挥作用的地方!
阿尔法级
假设检验的alpha 水平是我们用来确定 p 值是否低到足以拒绝原假设的阈值。通常设置为 0.05,但有时也设置为 0.01 或 0.10。
例如,如果我们将假设检验的 alpha 水平设置为 0.05 并获得 p 值为 0.02,我们将拒绝原假设,因为 p 值小于 alpha 水平。因此,我们得出的结论是,我们有足够的证据表明替代假设是正确的。
值得注意的是,α 水平还定义了错误地拒绝真零假设的概率。
例如,假设我们想要测试新药丸和当前药丸之间的平均血压降低是否存在差异。我们假设这两种药片没有区别。
如果我们将假设检验的 alpha 水平设置为 0.05,这意味着如果我们多次重复假设检验过程,我们预计会在大约 5% 的情况下错误地拒绝原假设。测试。
如何选择Alpha级别
如前所述,假设检验的 alpha 水平最常见的选择是 0.05。然而,在某些错误结论导致严重后果的情况下,我们可以将alpha水平设置得更低,也许是0.01。
例如,在医学领域,研究人员通常将 alpha 水平设置为 0.01,因为他们希望确保假设检验的结果是可靠的。
相反,在营销等领域,将 alpha 级别设置得较高可能更常见,例如 0.10,因为犯错误的后果既不是生也不是死。
应该注意的是,增加检验的 alpha 水平会增加找到显着性检验结果的机会,但也会增加我们错误地拒绝真实零假设的机会。
概括:
这是我们在本文中学到的内容:
1. p 值告诉我们获得至少与我们在样本数据中实际观察到的效果一样大的效果的概率。
2. alpha 水平是错误地拒绝真实原假设的概率。
3.如果假设检验的 p 值小于 alpha 水平,那么我们可以拒绝原假设。
4.增加检验的 alpha 水平会增加我们找到显着检验结果的机会,但也会增加我们错误地拒绝真实原假设的机会。