卡方检验和 t 检验:有什么区别?
卡方检验和t 检验是两种最常见的统计检验类型。因此,了解这两种测试之间的区别以及如何根据您想要回答的问题知道何时使用每种测试非常重要。
本教程简单解释了这两个测试之间的差异以及何时使用它们。
卡方检验
卡方检验实际上有几种不同的版本,但最常见的是卡方独立性检验。
定义
当我们想要正式测试两个分类变量之间是否存在统计上显着的关联时,我们使用卡方检验来检验独立性。
检验假设如下:
原假设(H 0 ):两个变量之间不存在显着关联。
替代假设: (Ha):两个变量之间存在显着关联。
例子
以下是我们何时可以使用卡方检验来检验独立性的一些示例:
示例 1:我们想知道性别(男性、女性)和政党偏好(共和党、民主党、独立党)之间是否存在统计上显着的关联。为了测试这一点,我们可以随机调查 100 人并记录他们的性别和政党偏好。然后,我们可以进行卡方检验,以确定性别和政党偏好之间是否存在统计上显着的关联。
示例 2:我们想知道班级水平(大一、大二、大三、大四)和最喜欢的电影类型(惊悚片、戏剧、西部片)之间是否存在统计上显着的关联。为了测试这一点,我们可以随机调查某所学校各个年级的 100 名学生,并记录他们最喜欢的电影类型。接下来,我们可以执行卡方独立性检验,以确定年级水平和最喜欢的电影类型之间是否存在统计上显着的关联。
示例 3:我们想知道一个人最喜欢的运动(篮球、棒球、足球)和他们长大的地方(城市、农村)之间是否存在统计上显着的关联。为了测试这一点,我们可以随机调查 100 个人,询问他们在什么类型的地方长大以及他们最喜欢的运动是什么。接下来,我们可以进行卡方检验,以确定一个人最喜欢的运动和他们长大的地方之间是否存在统计上显着的关联。
假设
在我们进行卡方独立性检验之前,我们必须首先确保满足以下假设以确保检验的有效性:
- 随机:应使用随机样本或随机实验从两个样本中收集数据。
- 分类:我们研究的变量必须是分类的。
- 大小:变量每个级别的预期观测值数量必须至少为 5。
如果这些假设得到验证,我们就可以进行测试。
t检验
t 检验也有几种不同的版本,但最常见的是均值差异的 t 检验。
定义
当我们想要正式测试两个总体均值之间是否存在统计显着差异时,我们使用t 检验来检验均值差异。
检验假设如下:
原假设(H 0 ):两个总体的均值相等。
替代假设: (Ha):两个总体的均值不相等。
注意:可以测试一个总体均值是否高于或低于另一个总体均值,但最常见的零假设是两个均值相等。
例子
以下是我们何时可以使用 t 检验来检验均值差异的一些示例:
示例 1:我们想知道饮食A或饮食B是否能带来更大的减肥效果。我们随机分配 100 人遵循饮食A两个月,另外 100 人遵循饮食B两个月。我们可以进行 t 检验来确定两组之间的平均体重减轻是否存在统计学上的显着差异。
示例 2:我们想知道两个不同的学习计划是否会导致学生获得不同的考试结果。我们在考试前一个月随机分配 50 名学生使用一种学习计划,50 名学生使用另一种学习计划。我们可以执行 t 检验来确定平均值的差异,从而确定两个学习计划之间的平均考试成绩是否存在统计上的显着差异。
示例 3:我们想知道两所不同学校的学生的平均身高是否相同。我们随机测量一所学校的 100 名学生和另一所学校的 100 名随机学生的身高。我们可以对均值差异进行 t 检验,以确定两所学校之间的学生平均身高是否存在统计上的显着差异。
假设
在我们对两个总体均值之间的差异进行假设检验之前,我们必须首先确保满足以下条件以确保假设检验的有效性:
- 随机:应使用随机样本或随机实验来收集两个样本的数据。
- 正态:抽样分布呈正态或近似正态。
- 独立性:两个样本是独立的。
如果满足这些假设,那么我们就可以进行假设检验。
如何知道何时使用每个测试
以下是每个测试的简要总结:
卡方独立性检验:允许您测试两个分类变量之间是否存在统计上显着的关联。当您拒绝卡方独立性检验的原假设时,这意味着两个变量之间存在显着关联。
均值差异 t 检验:允许您测试两个总体均值之间是否存在统计显着差异。当您拒绝均值差异的 t 检验的原假设时,这意味着两个总体的均值不相等。
了解是否使用卡方检验与 t 检验的最简单方法是简单地查看您正在使用的变量类型。
如果您有两个分类变量,也就是说,它们可以分为male 、 female 、 Republican 、 Democratic 、 independent等类别,那么您应该使用卡方检验。
但是,如果一个变量是分类变量(例如,学习计划类型 – 计划 1 或计划 2),而另一个变量是连续变量(例如,考试成绩 – 从 0 到 100 测量),那么您应该使用 t 检验。