如何在 python 中查找临界卡方值
当您执行卡方检验时,您会得到检验统计量。要确定卡方检验结果是否具有统计显着性,您可以将检验统计数据与临界卡方值进行比较。如果检验统计量大于临界卡方值,则检验结果具有统计显着性。
临界卡方值可以通过使用卡方分布表或使用统计软件找到。
要找到临界卡方值,您需要:
- 显着性水平(常见选择为 0.01、0.05 和 0.10)
- 自由程度
使用这两个值,您可以确定要与检验统计量进行比较的卡方值。
如何在 Python 中查找临界卡方值
要在 Python 中查找临界卡方值,您可以使用scipy.stats.chi2.ppf() 函数,该函数使用以下语法:
scipy.stats.chi2.ppf(q, df)
金子:
- q:使用的重要性级别
- df :自由度
此函数根据提供的显着性水平和自由度返回卡方分布的临界值。
例如,假设我们想要找到显着性水平为 0.05 且自由度 = 11 的临界卡方值。
import scipy.stats #find Chi-Square critical value scipy.stats.chi2.ppf(1-.05, df=11) 19.67514
显着性水平为 0.05 且自由度 = 11 的临界卡方值为19.67514 。
因此,如果我们执行某种类型的卡方检验,我们可以将卡方检验统计量与19.67514进行比较。如果检验统计量大于 19.67514,则检验结果具有统计显着性。
请注意,较小的 alpha 值将导致较高的临界卡方值。例如,考虑显着性水平为0.01且自由度 = 11 的临界卡方值。
scipy.stats.chi2.ppf(1-.01, df=11) 24.72497
并考虑具有完全相同自由度但显着性水平为0.005的临界卡方值:
scipy.stats.chi2.ppf(1-.005 df=11) 26.75685
有关 chi2.ppf() 函数的确切详细信息,请参阅SciPy 文档。