卡方独立性检验：定义、公式和示例

经过本杰明·安德森博 28 7 月, 2023 指导 0 条评论

卡方独立性检验用于确定两个分类变量之间是否存在显着关联。

本教程解释了以下内容：

进行独立性卡方检验的动机。
用于执行卡方独立性检验的公式。
如何执行卡方独立性检验的示例。

卡方独立性检验：动机

卡方独立性检验可用于确定许多不同上下文中两个 calcategori 变量之间是否存在关联。这里有些例子：

我们想知道性别是否与对政党的偏好有关。因此，我们调查了 500 名选民并记录了他们的性别和政党偏好。
我们想知道一个人最喜欢的颜色是否与他们最喜欢的运动相关。因此，我们调查了 100 个人，并询问他们对两者的偏好是什么。
我们想知道教育水平和婚姻状况是否相关。因此，我们从 50 人的简单随机样本中收集了这两个变量的数据。

在每种情况下，我们都想知道两个分类变量是否相互关联。在每种情况下，我们都可以使用卡方独立性检验来确定变量之间是否存在统计上显着的关联。

卡方独立性检验：公式

独立性的卡方检验使用以下原假设和备择假设：

H ₀ ：（零假设）两个变量是独立的。
H ₁ ：（替代假设）两个变量不是独立的。（即它们是关联的）

我们使用以下公式来计算卡方 x ²检验统计量：

X ² = Σ(OE) ² / E

金子：

Σ：是一个奇特的符号，意思是“和”
O：观测值
E：期望值

如果与具有 (#rows-1)*(#columns-1) 自由度的检验统计量 X ²对应的 p 值小于所选的显着性水平，则您可以拒绝原假设。

卡方独立性检验：示例

假设我们想知道性别是否与对政党的偏好相关。我们对 500 名选民进行了简单的随机抽样，并询问他们的政党偏好。下表列出了调查结果：

	共和党人	民主党人	独立的	全部的
男性	120	90	40	250
女性	110	95	45	250
全部的	230	185	85	500

使用以下步骤执行独立性卡方检验，以确定性别是否与政党偏好相关。

步骤 1：定义假设。

我们将使用以下假设进行卡方独立性检验：

H ₀ ：性别和政党偏好是独立的。
H ₁ ：性别和政党偏好不是独立的。

步骤 2：计算期望值。

接下来，我们将使用以下公式计算列联表中每个单元格的期望值：

期望值=（行数总和*列数总和）/表总和。

例如，共和党男性的期望值为： (230*250) / 500 = 115 。

我们可以重复此公式来获取每个表格单元格的期望值：

	共和党人	民主党人	独立的	全部的
男性	115	92.5	42.5	250
女性	115	92.5	42.5	250
全部的	230	185	85	500

步骤 3：计算表中每个单元格的 (OE) ² /E。

接下来，我们将计算表中每个单元格的(OE) ² /E，其中：

O：观测值
E：期望值

例如，男性共和党人的值为： (120-115) ² /115 = 0.2174 。

我们可以对表中的每个单元格重复此公式：

	共和党人	民主党人	独立的
男性	0.2174	0.0676	0.1471
女性	0.2174	0.0676	0.1471

步骤 4：计算检验统计量^X2和相应的 p 值。

X ² = σ (OE) ² / E = 0.2174 + 0.2174 + 0.0676 + 0.0676 + 0.1471 + 0.1471 = 0.8642

^根据卡方得分计算器计算出P值，与相关的p值

第五步：得出结论。

由于该 p 值不小于 0.05，因此我们无法拒绝原假设。这意味着我们没有足够的证据表明性别和政党偏好之间存在关联。

注意：您还可以仅使用卡方独立性测试计算器来执行整个测试。

其他资源

以下教程说明如何使用不同的统计程序执行卡方独立性检验：

如何在 Stata 中执行卡方独立性检验
 如何在 Excel 中执行卡方独立性检验
 如何在 SPSS 中执行卡方独立性检验
 如何在 Python 中执行卡方独立性检验
 如何在 R 中执行卡方独立性检验
 TI-84 计算器上的卡方独立性检验
 独立性卡方检验计算器

关于作者

本杰明·安德森博

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多