什么是可靠性分析? (定义&;示例)
在统计学中,术语“可靠性”是指测量的一致性。
如果我们衡量智力、知识、生产力、效率等。多次,我们无法测量它。在个体中,测量结果是否一致?
理想情况下,研究人员希望测试高度可靠,因为这意味着它随着时间的推移提供一致的测量结果,意味着测试结果是可信的。
事实证明,有四种方法可以衡量可靠性:
1.半分半可靠性法– 确定由于不良测试结构(例如措辞不当的问题或混乱的说明)而导致的测试结果错误程度。
该方法使用以下过程:
- 将测试分为两半。例如,一半可能由偶数问题组成,而另一半可能由奇数问题组成。
- 将每一半给予同一个人。
- 对一大群人重复上述步骤。
- 计算两半分数之间的相关性。
两半之间的相关性越高,测试或调查的内部一致性就越高。理想情况下,您希望两半之间的相关性较高,因为这表明测试的所有部分对所测量的内容都有同等的贡献。
2.重测可靠性方法– 确定由于管理问题(例如嘈杂的环境、照明不佳、完成测试的时间不足)而导致测试结果的错误程度。
该方法使用以下过程:
- 对一组人进行测试。
- 等待一定时间(数天、数周或数月)并对同一组个体进行相同的测试。
- 计算两次测试分数之间的相关性。
一般来说,至少 0.80 或更高的重测可靠性相关性表明可靠性良好。
3.并行形式可靠性方法– 确定由于外部影响而导致的测试结果的错误程度 – 例如,学生提前获得问题或学生在 s 中获得更高分数“只是导致更多”。
该方法使用以下过程:
- 对一组人进行一个版本的测试。
- 对同一组人进行另一种但同样困难的测试版本。
- 计算两次测试分数之间的相关性。
4.评估者间可靠性方法– 确定测试中的每个项目测量所测量的真实构造的一致性 – 例如,所有问题是否都清楚地传达并与所测量的构造相关?
此方法涉及多名经过培训的评分者或评委评估测试中的每个项目,然后计算评分者或评委之间的总体一致性百分比。
评委之间一致的百分比越高,测试的可靠性就越高。
可靠性与有效性
可靠性是指测量的一致性,有效性是指测试或量表测量其预期测量结构的程度。
好的测试或量表具有高信度和效度。然而,测试或量表有可能是可靠的但不是有效的。
例如,假设给定的箱子称重的秤始终比实际重量多 10 磅。这种秤是可靠的,因为它的测量结果是一致的,但它是无效的,因为它没有测量出真实的重量值。
测量的可靠性和标准误差
可靠性系数还可用于计算测量的标准误差,该误差可估计重复测量时个体“真实”分数周围的变化。
计算方法如下:
SE m = s√ 1-R
金子:
- s:测量值的标准偏差
- A:测试的信度系数
有关测量标准误差的详细说明,请参阅本文。