在教师招聘的历年考试中,衡量测验题目的质量指标有4个,分别是信度、效度、难度和区分度。在考试过程中,这个部分知识点相对较难理解,需要在理解的基础上了解它们的本质以及相关关系。
信度是指测验结果的稳定性或可靠性(一致性),即某一测验在多次施测后所得到的分数的稳定、一致程度。它既包括在时间上的一致性,也包括内容和不同评分者之间的一致性。例如小明在一周内三次站上体重秤去称体重,每次都几乎没有差别,说明这次测量是稳定可靠的,即说明测量的信度高。
效度是指测量的正确性(准确性),即一个测验能够测量出其所要测量的东西的程度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高。就一个测验的优劣而言,效度是一个比信度更为重要的指标。例如我们需要测量大家的教育学知识掌握水平,发放教育学内容的相关试卷,就可以有效测试出大家的真实水平,但是如发放心理学知识的试卷,则这套试卷并不能测试出大家的教育学知识掌握水平,说明其效度低。同时,例如教师发放试卷内容超出学生理解水平,或者太高于学生知识掌握范围,则都不能反映出学生真实水平,这种情况下效度均低。
难度是指测验包含的试题难易程度。在教学测量中,通常用答对或通过测验的人数比例作为难度值。在一场合格性测验中,难度值主要看通过的人多不多,通过的人多难度低,人少则难度值高。
区分度有时也称鉴别力,主要指测验对于不同水平的被试加以区分的能力。区分度与难度有关,只有在试卷中包含有不同难度的试题,才能提高区分度,拉开考生得分的差距。在一场考试过程中,如所有题目难度均高,则不利于
信度是指测验结果的稳定性或可靠性(一致性),即某一测验在多次施测后所得到的分数的稳定、一致程度。它既包括在时间上的一致性,也包括内容和不同评分者之间的一致性。例如小明在一周内三次站上体重秤去称体重,每次都几乎没有差别,说明这次测量是稳定可靠的,即说明测量的信度高。
效度是指测量的正确性(准确性),即一个测验能够测量出其所要测量的东西的程度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高。就一个测验的优劣而言,效度是一个比信度更为重要的指标。例如我们需要测量大家的教育学知识掌握水平,发放教育学内容的相关试卷,就可以有效测试出大家的真实水平,但是如发放心理学知识的试卷,则这套试卷并不能测试出大家的教育学知识掌握水平,说明其效度低。同时,例如教师发放试卷内容超出学生理解水平,或者太高于学生知识掌握范围,则都不能反映出学生真实水平,这种情况下效度均低。
难度是指测验包含的试题难易程度。在教学测量中,通常用答对或通过测验的人数比例作为难度值。在一场合格性测验中,难度值主要看通过的人多不多,通过的人多难度低,人少则难度值高。
区分度有时也称鉴别力,主要指测验对于不同水平的被试加以区分的能力。区分度与难度有关,只有在试卷中包含有不同难度的试题,才能提高区分度,拉开考生得分的差距。在一场考试过程中,如所有题目难度均高,则不利于