一、信度的定义。
1.信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致性程度。
2.在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。
3.信度也可以看作在总方差中非测量误差的方差所占的比例。
二、信度的评估类型与方法
1.重测信度:又称稳定性系数,它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。
最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
2.复本信度:又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。
如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。
3.内部一致性信度。⑴分半信度⑵同质性信度:代表测验内部所有题目间的一致性。
4.评分者信度:用于测量不同评分者之间所产生的误差。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。
三、信度与测验分数的解释
1、确定信度可以接受的水平,一般原则是:当rxx <0.70时,测验不能用;当 0.70 ≤ rxx <0.85时,可用于团体比较;当rxx ≥0.85时,才能用来鉴别或预测个人成绩或作为。
2.解释个人分数的意义:从信度可以解释个人分数的意义,这就是测量标准误的应用。它有两个作用:
⑴估计真实分数的范围;⑵了解实得分数再测时可能的变化情形。
例:假设在一个智力测验中,某个被试的IQ为100,这是否反映的他的真实水平?如果再测一次,他的分数将改变多少?已知该智力测验的标准差为15,信度系数为0.84,则其真实IQ有95%的可能性落在88-112之间。即若再测一次,他的智商低于88、高于112的可能性不超过5%。
3.比较不同测验分数的差异。
例:某被试在韦氏成人智力测验中言语智商为102,操作智商为110.已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88.问:其操作智商是否显著高于言语智商呢?
答:在统计上,经常要求两个分数的差异程度达到0.05即5%的显著水平,才能承认不是误差的影响。因此,个体在韦氏测验两半得分的差异高于大约15分,才能达到0.05的显著水平。上述被试的差异分类为110-102=8是不显著的。
四、洛德提出在学绩测验中,为了保持其可靠性,各类选择题的理想平均难度为:五择一,0.70;四择一,0.74;三择一,0.77;是非题,0.85。