R 中的卡方独立性检验(附示例)
本教程介绍如何在 R 中执行独立性的卡方检验。
示例:R 中独立性的卡方检验
假设我们想知道性别是否与对政党的偏好相关。我们对 500 名选民进行了简单的随机抽样,并询问他们的政党偏好。下表列出了调查结果:
共和党人 | 民主党人 | 独立的 | 全部的 | |
男性 | 120 | 90 | 40 | 250 |
女性 | 110 | 95 | 45 | 250 |
全部的 | 230 | 185 | 85 | 500 |
使用以下步骤在 R 中执行独立性卡方检验,以确定性别是否与政党偏好相关。
第 1 步:创建数据。
首先,我们将创建一个表来保存数据:
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
步骤 2:执行独立性卡方检验。
接下来,我们可以使用chisq.test()函数执行卡方独立性检验:
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
结果解释方式如下:
- 卡方检验统计量: 0.86404
- 自由度: 2 (计算为#rows-1 * #columns-1)
- p 值: 0.6492
回想一下, 独立性的卡方检验使用以下原假设和备择假设:
- H 0 :(零假设)两个变量是独立的。
- H 1 :(替代假设)两个变量不是独立的。
由于检验的 p 值 (0.6492) 不小于 0.05,因此我们无法拒绝原假设。这意味着我们没有足够的证据表明性别和政党偏好之间存在关联。
换句话说,性别和政党偏好是独立的。