什么是内容效度? (定义&;示例)
术语内容效度是指调查或测试衡量其旨在衡量的结构的程度。
例如,假设一位教授想要测试他的学生对基础统计学的整体知识。如果满足以下条件,则其测试将具有内容有效性:
- 该测试涵盖了他在课堂上教授的所有基本统计主题。
- 考试不涉及历史、经济、生物等不相关的主题。
如果测试没有涵盖要衡量的概念的所有方面,或者涵盖与概念无关的主题,则测试缺乏内容有效性。
什么时候使用内容效度?
在实践中,内容效度通常用于评估评估内容知识的测试的有效性。示例包括:
示例1:统计学期末考试
如果统计课程学期末的期末考试涵盖了课程中涵盖的所有主题并排除了所有其他不相关的主题,则该考试具有内容有效性。
示例2:飞行员执照
测试个人是否有足够的知识来获得飞行员执照的考试如果包括涵盖飞行员课程中所有可能主题的问题并排除与执照无关的所有其他问题,则该考试具有内容有效性。
示例3:房产证
如果考试涵盖了房地产经纪人应理解的所有主题并排除了所有其他不相关的问题,那么测试个人是否有足够的知识来获得房地产许可证的考试将具有内容有效性。
在每种情况下,内容有效性都可以帮助确定测试是否涵盖了其旨在测量的结构的所有方面。
如何衡量内容效度
在1975 年的一篇文章中,CH Lawshe 开发了以下评估内容有效性的技术:
步骤 1:从主题专家那里收集数据。
Lawshe 建议小组中的每位主题专家 (SME) 回答以下问题:
“该项目所衡量的技能或知识对于完成这项工作是“必要的”、“有用但不是必要的”还是“不必要的”?
每个 SME 都必须为测试中的每个问题提供此答案。
步骤2:计算内容有效性。
接下来,Lawshe提出了以下公式来量化每个试题的内容有效性:
内容效度=( ne – N/2)/(N/2)
金子:
- n e :表示“必要”的主题专家数量
- N:中小企业小组成员总数
如果给定问题的内容有效性低于某个临界值,则该问题很可能没有像应有的那样衡量兴趣的结构。
下表列出了根据中小企业小组成员数量划分的临界值:
内容效度指数,表示为 CVI,是测试中所有问题的内容效度的平均率。 CVI 越接近 1,测试的整体内容效度越高。
以下示例显示如何计算特定测试的内容有效性。
示例:测量内容有效性
假设我们要求由 10 名评委组成的小组对测试中的 6 个项目进行评分。下表中的绿色框表示哪些法官将每个要素评为“必要”:
第一个元素的内容有效性计算如下:
内容效度=( ne – N/2)/(N/2)=(9 – 10/2)/(10/2)= 0.8
我们可以用同样的方式计算每个元素的内容有效性:
从临界值表中我们可以看到,只有当一个项目的CVR值大于0.62时,它才被认为对于10名评审团来说具有内容有效性。
对于这个特定的测试,只有三个项目超过了这个阈值。
最后,我们还可以将整个测试的内容效度指数(CVI)计算为所有 CVR 值的平均值:
IVC = (0.8 -0.2 + 1 + 0.8 + 0.6 + 0) / 6 = 0.5
该 CVI 值相当低,表明该测试可能没有充分衡量兴趣概念。
建议删除或修改CVR值较低的项目,以提高测试的整体内容有效性。
内容有效性对比表面效度
内容效度与表面效度不同,表面效度是指一项调查或测试对于回应者和实施者来说从表面上看都是有效的。
表面有效性是一种评估测试有效性的技术性较低的方法,通常仅用作检测测试在使用前是否需要以某种方式进行修改的快速方法。