贝叶斯因子:定义+解释
当我们进行假设检验时,我们通常会得到一个 p 值,我们将其与某个 alpha 水平进行比较,以决定是否应该拒绝原假设。
例如,我们可以使用 0.05 的 alpha 水平执行两个样本 t 检验,以确定两个总体的均值是否相等。假设我们运行测试并得到 p 值为 0.0023。在这种情况下,我们将拒绝两个总体均值相等的零假设,因为 p 值小于所选的 alpha 水平。
P值是拒绝或未能拒绝某些假设的常用衡量标准,但也可以使用另一种衡量标准:贝叶斯因子。
贝叶斯因子定义为特定假设的概率与另一个假设的概率之比。通常,它用于求备择假设的概率与原假设的概率之间的比率:
贝叶斯因子 =提供数据的概率 H A / 提供数据的概率 H 0
例如,如果贝叶斯因子为 5,则意味着在给定数据的情况下,备择假设的可能性是原假设的 5 倍。
相反,如果贝叶斯因子为 1/5,则意味着在给定数据的情况下,原假设的可能性是备择假设的 5 倍。
与 p 值类似,我们可以使用阈值来决定何时拒绝原假设。例如,我们可能认为 10 或更大的贝叶斯因子构成了足够有力的证据来拒绝原假设。
Lee 和 Wagenmaker 在2015 年的一篇论文中提出了对贝叶斯因子的以下解释:
贝叶斯因子 | 解释 |
---|---|
> 100 | 另一种假设的极端证据 |
30 – 100 | 替代假设的有力证据 |
10 – 30 | 替代假设的有力证据 |
3 – 10 | 支持替代假设的适度证据 |
1 – 3 | 另一种假设的轶事证据 |
1 | 没有证据 |
1/3 – 1 | 原假设的轶事证据 |
1/3 – 1/10 | 支持原假设的适度证据 |
1/10 – 1/30 | 零假设的有力证据 |
1/30 – 1/100 | 零假设的有力证据 |
<1/100 | 原假设的极端证据 |
贝叶斯因子与 P 值
贝叶斯因子和p值有不同的解释。
P 值:
p 值被解释为假设原假设正确,获得与假设检验的观察结果一样极端的结果的概率。
例如,假设您正在执行两个样本 t 检验来确定两个总体的均值是否相等。如果检验结果的 p 值为 0.0023,则意味着如果两个总体的均值确实相等,则获得此结果的概率仅为0.0023 。由于该值非常小,因此我们拒绝原假设并得出结论:我们有足够的证据表明两个总体的均值不相等。
贝叶斯因素:
贝叶斯因子被解释为在备择假设下观察到的数据发生的概率与在原假设下发生的观察到的数据的概率之比。
例如,假设您执行假设检验,得到的贝叶斯因子为 4。这意味着,根据您实际观察到的数据,备择假设的可能性是原假设的 4 倍。
结论
一些统计学家认为,贝叶斯因子比 p 值更具优势,因为它有助于量化支持和反对两个相互竞争的假设的证据。例如,可以对支持或反对原假设的证据进行量化,而这不能使用 p 值来完成。
无论您使用哪种方法(贝叶斯因子或 p 值),您仍然需要决定是否要拒绝零假设的阈值。
例如,在上表中,我们看到贝叶斯因子为 9 将被分类为“替代假设的中等证据”,而贝叶斯因子为 10 将被分类为“替代假设的有力证据”。
从这个意义上说,贝叶斯因子也面临同样的问题:p 值为 0.06 被认为“不显着”,而 p 值为 0.05 则被认为“显着”。
进一步阅读: