如何在 stata 中执行卡方独立性检验
卡方独立性检验用于确定两个分类变量之间是否存在显着关联。
本教程介绍如何在 Stata 中执行卡方独立性检验。
示例:Stata 中独立性的卡方检验
在此示例中,我们将使用名为auto的数据集,其中包含 1978 年以来 74 辆不同汽车的信息。
按照以下步骤执行卡方独立性检验,以确定以下两个变量之间是否存在显着关联:
- rep78: 1978年汽车被修理的次数(从1到5不等)
- foreign:车型是否为国外(0=否,1=是)
步骤1:加载并显示原始数据。
首先,我们将通过键入以下命令来加载数据:
系统自动使用
我们可以通过输入以下命令来查看原始数据:
br
每行显示有关一辆汽车的信息,包括价格、英里/加仑、重量、长度和各种其他变量。我们唯一感兴趣的两个变量是rep78和Foreign 。
步骤 3:执行独立性卡方检验。
我们将使用以下语法来执行测试:
选项卡第一个变量第二个变量,chi2
以下是我们将在本例中使用的确切语法:
国外rep78标签,chi2
以下是如何解释结果:
汇总表:该表显示了rep78和foreign的每个组合的总数。例如
- 1978年有国产车2辆、修理车1辆。
- 1978年有国产车8辆,接受修理2辆。
- 1978年,国产汽车27辆,修理3次。
等等。
Pearson chisq(4):这是检验的卡方检验统计量。结果是 27.2640。
Pr:这是与卡方检验统计量相关的 p 值。结果是 0.000。由于该值小于 0.05,因此我们无法拒绝两个变量独立的原假设。我们有足够的证据可以得出结论,汽车是否是外国汽车与其所接受的维修总数之间存在统计学上的显着关联。