如何在 python 中执行卡方独立性检验


独立性的 方检验 用于确定两个分类变量之间是否存在显着关联。

本教程介绍如何在 Python 中执行卡方独立性检验。

示例:Python 中的卡方独立性检验

假设我们想知道性别是否与对政党的偏好相关。我们对 500 名选民进行了简单的随机抽样,并询问他们的政党偏好。下表列出了调查结果:

共和党人 民主党人 独立的 全部的
男性 120 90 40 250
女性 110 95 45 250
全部的 230 185 85 500

使用以下步骤在 Python 中执行卡方独立性检验,以确定性别是否与政党偏好相关。

第 1 步:创建数据。

首先,我们将创建一个表来保存数据:

 data = [[120, 90, 40],
        [110, 95, 45]]

步骤 2:执行独立性卡方检验。

接下来,我们可以使用 SciPy 库中的chi2_contingency 函数执行卡方独立性测试,该函数使用以下语法:

chi2_contingency(观察到的)

金子:

  • 观察值:观察值的列联表。

下面的代码展示了如何在我们的具体示例中使用该函数:

 import scipy.stats as stats

#perform the Chi-Square Test of Independence
stats.chi2_contingency(data)

(0.864,
 0.649,
 2,
 array([[115. , 92.5, 42.5],
        [115. , 92.5, 42.5]]))

结果解释方式如下:

  • 卡方检验统计量: 0.864
  • p 值: 0.649
  • 自由度: 2 (计算为#rows-1 * #columns-1)
  • 表:最后一个表显示列联表中每个单元格的预期值。

回想一下,独立性的卡方检验使用以下原假设和备择假设:

  • H 0 :(零假设)两个变量是独立的。
  • H 1 :(替代假设)两个变量不是独立的。

由于检验的 p 值 (0.649) 不小于 0.05,因此我们无法拒绝原假设。这意味着我们没有足够的证据表明性别和政党偏好之间存在关联。

换句话说,性别和政党偏好是独立的。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注