R 中的卡方独立性检验(附示例)


卡方独立性检验用于确定两个分类变量之间是否存在显着关联。

本教程介绍如何在 R 中执行独立性的卡方检验。

示例:R 中独立性的卡方检验

假设我们想知道性别是否与对政党的偏好相关。我们对 500 名选民进行了简单的随机抽样,并询问他们的政党偏好。下表列出了调查结果:

共和党人 民主党人 独立的 全部的
男性 120 90 40 250
女性 110 95 45 250
全部的 230 185 85 500

使用以下步骤在 R 中执行独立性卡方检验,以确定性别是否与政党偏好相关。

第 1 步:创建数据。

首先,我们将创建一个表来保存数据:

 #create table
data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE )
colnames(data) <- c(" Rep "," Dem "," Ind ")
rownames(data) <- c(" Male "," Female ")
data <- as.table (data)

#view table
data

       Rep Dem Ind
Male 120 90 40
Female 110 95 45

步骤 2:执行独立性卡方检验。

接下来,我们可以使用chisq.test()函数执行卡方独立性检验:

 #Perform Chi-Square Test of Independence
chisq.test(data)

	Pearson's Chi-squared test

data:data
X-squared = 0.86404, df = 2, p-value = 0.6492

结果解释方式如下:

  • 卡方检验统计量: 0.86404
  • 自由度: 2 (计算为#rows-1 * #columns-1)
  • p 值: 0.6492

回想一下, 独立性的卡方检验使用以下原假设和备择假设:

  • H 0 :(零假设)两个变量是独立的。
  • H 1 :(替代假设)两个变量不是独立的。

由于检验的 p 值 (0.6492) 不小于 0.05,因此我们无法拒绝原假设。这意味着我们没有足够的证据表明性别和政党偏好之间存在关联。

换句话说,性别和政党偏好是独立的。

其他资源

卡方独立性检验简介
独立性卡方检验计算器
如何计算 R 中卡方统计量的 P 值
如何找到R中的临界卡方值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注