如何在 stata 中执行卡方拟合优度检验


卡方拟合优度检验用于确定分类变量是否遵循假设分布。

本教程介绍如何在 Stata 中执行卡方拟合优度检验。

示例:Stata 中的卡方拟合优度检验

为了说明如何执行此测试,我们将使用一个名为nlsw88的数据集,其中包含 1988 年美国女性工作统计信息。

按照以下步骤执行卡方拟合优度检验,以确定该数据集中种族的真实分布是否为:70% 白人、20% 黑人、10% 其他。

步骤1:加载并显示原始数据。

首先,我们将通过键入以下命令来加载数据:

NLSW88系统

我们可以通过输入以下命令来查看原始数据:

br

在 Stata 中查看原始数据

每行显示有关个人的信息,包括年龄、种族、婚姻状况、教育水平和各种其他因素。

步骤2:加载调整包。

要执行适用性测试,我们需要安装csgof软件包。我们可以通过输入以下命令来做到这一点:

找到CSGO

将出现一个新窗口。单击https://stats.idre.ucla.edu/stat/stata/ado/analysis 中显示 csgof 的链接。

将出现另一个窗口。单击显示“单击此处安装”的链接。

安装该软件包只需几秒钟。

步骤 3:进行适合性测试。

安装软件包后,我们可以对数据进行拟合优度测试,以确定真正的种族分类是否为:70% 白人、20% 黑人、10% 其他。

我们将使用以下语法来执行测试:

csgof 感兴趣的变量,expperc(list_of_expected_percentages)

以下是我们将在本例中使用的确切语法:

运行 csgof, expperc(70, 20, 10)

Stata中卡方的拟合优度

以下是如何解释结果:

摘要框:此框向我们显示每场比赛的预期百分比、预期频率和观察到的频率。例如:

  • 白人的预期比例为 70%。这是我们指定的百分比。
  • 白人的预期频率为 1,572.2。这是根据数据集中有 2,246 个人这一事实计算得出的,因此该数字的 70% 是 1,572.2。
  • 观察到的白人个体频率为 1,637。这是数据集中白人的实际数量。

Chisq(2):这是拟合优度检验的卡方检验统计量。结果是218.13。

p:这是与卡方检验统计量相关的 p 值。结果是 0。由于它小于 0.05,我们无法拒绝真实种族分布为 70% 白人、20% 黑人和 10% 其他人的原假设。我们有足够的证据可以得出结论,真实的种族分布与这种假设的分布不同。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注