什么时候拒绝原假设? (3个例子)
假设检验是一种正式的统计检验,我们用它来拒绝或未能拒绝统计假设。
我们总是使用以下步骤来进行假设检验:
步骤 1:陈述原假设和备择假设。
原假设,表示为H0 ,是样本数据仅来自偶然的假设。
备择假设,表示为HA ,是样本数据受到非随机原因影响的假设。
2. 确定要使用的显着性水平。
确定重要性级别。常见选择为 .01、.05 和 .1。
3. 计算检验统计量和 p 值。
使用样本数据计算检验统计量和相应的p 值。
4. 拒绝或不拒绝原假设。
如果 p 值低于显着性水平,则您拒绝原假设。
如果 p 值不低于显着性水平,则无法拒绝原假设。
您可以使用以下漂亮的行来记住此规则:
“如果 p 很弱,零值必定消失。”
换句话说,如果 p 值足够低,那么我们必须拒绝原假设。
以下示例显示何时拒绝(或不拒绝)最常见类型的假设检验的原假设。
示例 1:单样本 t 检验
单样本 t 检验用于测试总体平均值是否等于某个值。
例如,假设我们想知道某种乌龟的平均重量是否为 310 磅。
我们出去收集了 40 只海龟的简单随机样本,其中包含以下信息:
- 样本量 n = 40
- 平均样本重量x = 300
- 样本标准差 s = 18.5
我们可以使用以下步骤来执行单样本 t 检验:
步骤 1:陈述原假设和备择假设
我们将使用以下假设进行单样本 t 检验:
- H 0 : μ = 310(总体平均值等于 310 本书)
- H A : μ ≠ 310(总体平均值不等于 310 磅)
2. 确定要使用的显着性水平。
我们将选择使用显着性水平0.05 。
3. 计算检验统计量和 p 值。
我们可以将样本量、样本均值和样本标准差的数字插入到这个单样本 t 检验计算器中,以计算检验统计量和 p 值:
- t 检验统计量:-3.4187
- 两侧 p 值:0.0015
4. 拒绝或不拒绝原假设。
由于 p 值 (0.0015) 小于显着性水平 (0.05),因此我们拒绝原假设。
我们的结论是,有足够的证据表明该种群中海龟的平均重量不等于 310 磅。
示例 2:两个样本 t 检验
双样本 t 检验用于检验两个总体的均值是否相等。
例如,假设我们想知道两种不同种类的海龟的平均重量是否相等。
我们从每个群体中收集一个简单的随机样本,其中包含以下信息:
样本1:
- 样本量 n 1 = 40
- 平均样本重量x 1 = 300
- 样本标准差 s 1 = 18.5
样本2:
- 样本量 n 2 = 38
- 平均样本重量x 2 = 305
- 样本标准差 s 2 = 16.7
我们可以使用以下步骤来执行双样本 t 检验:
步骤 1:陈述原假设和备择假设
我们将使用以下假设进行双样本 t 检验:
- H 0 : μ 1 = μ 2 (两个总体平均值相等)
- H 1 : μ 1 ≠ μ 2 (两个总体平均值不相等)
2. 确定要使用的显着性水平。
我们将选择使用显着性水平0.10 。
3. 计算检验统计量和 p 值。
我们可以将样本量、样本均值和样本标准差的数字插入到这个双样本 t 检验计算器中,以计算检验统计量和 p 值:
- t 检验统计量:-1.2508
- 两侧 p 值:0.2149
4. 拒绝或不拒绝原假设。
由于 p 值 (0.2149) 不小于显着性水平 (0.10),因此我们无法拒绝原假设。
我们没有足够的证据表明这两个种群的海龟平均体重不同。
示例 3:配对样本 t 检验
当一个样本中的每个观察值可以与另一个样本中的观察值相关联时,配对样本 t 检验用于比较两个样本的平均值。
例如,假设我们想知道某个训练计划是否能够提高大学篮球运动员的最大垂直弹跳。
为了测试这一点,我们可以招募 20 名大学篮球运动员作为简单的随机样本,并测量他们每个人的最大垂直弹跳。然后我们可以让每个球员使用一个月的训练计划,然后在月底再次测量他们的最大垂直弹跳:
我们可以使用以下步骤来执行配对样本 t 检验:
步骤 1:陈述原假设和备择假设
我们将使用以下假设对配对样本进行 t 检验:
- H 0 : μ before = μ after (两个总体平均值相等)
- H 1 : μ之前≠ μ之后(两个总体平均值不相等)
2. 确定要使用的显着性水平。
我们将选择使用显着性水平0.01 。
3. 计算检验统计量和 p 值。
我们可以将每个样本的原始数据插入到 配对样本 t 检验计算器中,以计算检验统计量和 p 值:
- t 检验统计量:-3.226
- 两侧 p 值:0.0045
4. 拒绝或不拒绝原假设。
由于 p 值 (0.0045) 小于显着性水平 (0.01),因此我们拒绝原假设。
我们有足够的证据表明,参加训练计划之前和之后的平均垂直弹跳并不相等。
奖励:决策规则计算器
您可以使用此决策规则计算器根据检验统计量的值自动确定是否拒绝假设检验的原假设。