如何在 python 中执行卡方独立性检验
独立性的卡 方检验 用于确定两个分类变量之间是否存在显着关联。
本教程介绍如何在 Python 中执行卡方独立性检验。
示例:Python 中的卡方独立性检验
假设我们想知道性别是否与对政党的偏好相关。我们对 500 名选民进行了简单的随机抽样,并询问他们的政党偏好。下表列出了调查结果:
共和党人 | 民主党人 | 独立的 | 全部的 | |
男性 | 120 | 90 | 40 | 250 |
女性 | 110 | 95 | 45 | 250 |
全部的 | 230 | 185 | 85 | 500 |
使用以下步骤在 Python 中执行卡方独立性检验,以确定性别是否与政党偏好相关。
第 1 步:创建数据。
首先,我们将创建一个表来保存数据:
data = [[120, 90, 40], [110, 95, 45]]
步骤 2:执行独立性卡方检验。
接下来,我们可以使用 SciPy 库中的chi2_contingency 函数执行卡方独立性测试,该函数使用以下语法:
chi2_contingency(观察到的)
金子:
- 观察值:观察值的列联表。
下面的代码展示了如何在我们的具体示例中使用该函数:
import scipy.stats as stats #perform the Chi-Square Test of Independence stats.chi2_contingency(data) (0.864, 0.649, 2, array([[115. , 92.5, 42.5], [115. , 92.5, 42.5]]))
结果解释方式如下:
- 卡方检验统计量: 0.864
- p 值: 0.649
- 自由度: 2 (计算为#rows-1 * #columns-1)
- 表:最后一个表显示列联表中每个单元格的预期值。
回想一下,独立性的卡方检验使用以下原假设和备择假设:
- H 0 :(零假设)两个变量是独立的。
- H 1 :(替代假设)两个变量不是独立的。
由于检验的 p 值 (0.649) 不小于 0.05,因此我们无法拒绝原假设。这意味着我们没有足够的证据表明性别和政党偏好之间存在关联。
换句话说,性别和政党偏好是独立的。