假设对比
本文解释了统计学中的假设检验是什么。因此,您将学习如何进行假设检验、不同类型的假设检验以及进行假设检验时可能出现的错误。
什么是假设检验?
假设检验是用于拒绝或否定统计假设的程序。在假设检验中,我们判断总体参数的值是否与在所述总体样本中观察到的结果一致。
也就是说,在假设检验中,对统计样本进行分析,并根据获得的结果确定是拒绝还是接受先前建立的假设。
请记住,一般来说,从假设检验中,人们无法完全确定地推断假设是真是假,但假设只是被拒绝或不基于所获得的结果。因此,在检验假设时,即使有统计证据表明所做的决定是最有可能的,仍然可能会犯错误。
在统计学中,假设检验也称为假设检验、假设检验或显着性检验。
假设检验理论由英国统计学家罗纳德·费舍尔 (Ronald Fisher) 建立,并由杰西·内曼 (Jerzy Neyman) 和埃贡·皮尔逊 (Egon Pearson) 进一步发展。
原假设和备择假设
假设检验由两种类型的统计假设组成:
- 零假设 (H 0 ) :该假设认为我们关于总体参数的初始假设是错误的。因此,零假设是我们希望拒绝的假设。
- 备择假设(H 1 ) :是其真实性应该被证明的研究假设。也就是说,备择假设是研究者的先验假设,为了试图证明其正确性,将进行对比假设。
实际上,备择假设是在原假设之前制定的,因为备择假设旨在通过数据样本的统计分析来证实。然后简单地通过反驳备择假设来制定原假设。
假设检验的类型
假设检验可以分为两种不同的类型:
- 双尾假设检验(或双尾假设检验) :假设检验的备择假设指出总体参数与特定值“不同”。
- 单尾假设检验(或单尾假设检验) :假设检验的备择假设表明总体参数“大于”(右尾)或“小于”(左尾)某个特定值。
双尾假设检验
单尾假设检验(右尾)
单尾假设检验(左尾)
假设检验的拒绝区域和接受区域
正如我们将在下面详细看到的,假设检验包括计算每种假设检验的特征值,该值称为假设检验统计量。因此,一旦计算出对比度统计量,就需要观察它位于以下两个区域中的哪一个区域才能得出结论:
- 拒绝区域(或临界区域) :这是涉及拒绝原假设(并接受备择假设)的假设检验参考分布的图形区域。
- 接受区域:这是假设检验参考分布的图形区域,意味着接受原假设(并拒绝备择假设)。
简而言之,如果检验统计量落在拒绝区内,则拒绝原假设并接受备择假设。相反,如果检验统计量落在接受区域内,则接受原假设并拒绝备择假设。
建立拒绝区域和接受区域边界的值称为临界值,类似地,定义拒绝区域的值的区间称为置信区间。这两个值都取决于所选的显着性水平。
另一方面,拒绝或接受原假设的决定也可以通过将从假设检验获得的p 值(或 p 值)与所选显着性水平进行比较来做出。
如何进行假设检验
要进行假设检验,应遵循以下步骤:
- 陈述假设检验的原假设和备择假设。
- 建立所需的 alpha (α) 显着性水平。
- 计算假设对比统计量。
- 确定假设检验的临界值,以了解假设检验的拒绝域和接受域。
- 观察假设对比统计量是在拒绝区域还是接受区域。
- 如果统计量落在拒绝区域内,则拒绝原假设(并接受备择假设)。但如果统计量落在接受区内,则接受原假设(并拒绝备择假设)。
假设检验错误
在假设检验中,当拒绝一个假设并接受另一个检验假设时,可能会犯以下两个错误之一:
- I 类错误:这是在原假设为真时拒绝原假设时所犯的错误。
- II 类错误:这是在原假设实际上为假时接受原假设而犯的错误。
另一方面,犯每种类型错误的概率如下:
- Alpha概率(α) :是犯第一类错误的概率。
- Beta概率(β) :是犯第二类错误的概率。
类似地,假设检验的功效被定义为当原假设(H 0 )为假时拒绝原假设(H 0 )的概率,或者换句话说,它是当备择假设(H 1 )为真时选择它的概率。因此,假设检验的功效等于 1-β。
假设检验统计
假设检验的统计量是假设检验参考分布的值,用于确定是否拒绝原假设。如果检验统计量落入拒绝域,则拒绝原假设(并接受备择假设),反之,如果检验统计量落入接受域,则接受原假设(并接受备择假设)拒绝)。替代假设)。
假设检验统计量的计算取决于检验的类型。因此,每种假设检验的统计量计算公式如下所示。
均值的假设检验
已知方差的均值的假设检验统计量的公式为:
金子:
-
是平均值的假设对比统计量。
-
是样本均值。
-
是建议的平均值。
-
是总体标准差。
-
是样本大小。
计算平均值的假设检验统计量后,必须解释结果是否拒绝原假设:
- 如果均值的假设检验是双向的,则当统计量的绝对值大于临界值 Z α/2时,将拒绝原假设。
- 如果均值的假设检验与右尾匹配,且统计量大于临界值 Z α ,则拒绝原假设。
- 如果均值的假设检验与左尾匹配,且统计量小于临界值 -Z α ,则拒绝原假设。
在这种情况下,临界值是从标准化正态分布表中获得的。
另一方面,方差未知的均值的假设检验统计量的公式为:
金子:
-
是平均值的假设检验统计量,由学生 t 分布定义。
-
是样本均值。
-
是建议的平均值。
-
是样本标准差。
-
是样本大小。
和以前一样,检验统计量的计算结果必须用临界值来解释,以拒绝或不拒绝原假设:
- 如果均值的假设检验是双向的,并且统计量的绝对值大于临界值 t α/2|n-1 ,则拒绝原假设。
- 如果均值的假设检验与右尾匹配,且统计量大于临界值 t α|n-1 ,则拒绝原假设。
- 如果均值的假设检验与左尾匹配,且统计量小于临界值 -t α|n-1 ,则拒绝原假设。
当方差未知时,从Student分布表中获得临界测试值。
比例假设检验
比例假设检验统计量的公式为:
金子:
-
是该比例的假设检验统计量。
-
是样本比例。
-
是建议的比例值。
-
是样本大小。
-
是比例的标准差。
请记住,计算比例的假设检验统计量是不够的,但必须解释结果:
- 如果该比例的假设检验是双向的,则当统计量的绝对值大于临界值 Z α/2时,将拒绝原假设。
- 如果该比例的假设检验与右尾匹配,且统计量大于临界值 Z α ,则拒绝原假设。
- 如果比例的假设检验与左尾匹配,且统计量小于临界值 -Z α ,则拒绝原假设。
请记住,可以从标准正态分布表中轻松获得临界值。
方差假设检验
方差假设检验统计量的计算公式为:
金子:
-
是方差的假设检验统计量,具有卡方分布。
-
是样本大小。
-
是样本方差。
-
是建议总体的方差。
为了解释统计结果,必须将获得的值与测试的临界值进行比较。
- 如果方差假设检验是双尾的,则当统计量大于临界值时,将拒绝原假设。
或者如果临界值小于
。
- 如果方差的假设检验与右尾匹配,且统计量大于临界值,则拒绝原假设
。
- 如果方差假设检验与左尾匹配,且统计量小于临界值,则拒绝原假设
。
方差的临界假设检验值是从卡方分布表中获得的。请注意,卡方分布的自由度是样本大小减 1。