测评技术是影响教育评价改革的关键

文 / 张勇 责编 / 屠桂芳 2019-03-29 点击 413

张勇
 
怎样评价你的成长 视觉中国 供图

 

    迄今为止,人类教育评价走过了这样一条历史途径:从观察、测量到测量与质性研究并重,并给出诊断和意义以及价值判断。教育评价的发展大致经历了测量、描述、判断、建构和综合等阶段。

    第一代教育评价叫测量。测量是获取教育数据的有效可靠方法,主要追求测量与测量结果的标准化、客观化,主要是测量技术与手段大量应用(真分数理论与技术的应用)。

    第二代教育评价是描述。描述是对测量所得数据进行事实还原,再解释学生学习达成教育目标的程度,主要以教育目标理论或概化理论为应用,对每一次测验与考试的结果进行描述或描述性分析。这种“双基”测验与考试,正是导致“应试”的技术源头。

    第三代教育评价叫判断。描述对于目标而言,具有统一性,而学生是多元化的、个性化的,所以在判断学生价值上就出现了冲突。追求学生认知的多元化,就导致了必须以多元化的价值标准来判定学生发展。在此背景下,根据测量所得的事实判断学生发展情况、以能力倾向判断学生发展的项目反应理论产生。对于这类评价来说,制定价值判断标准尤为重要。

    20世纪80年代,第四代教育评价——“建构”时代开始了,主要研究教育建构过程、方法和特征,认知诊断理论和多维项目反应理论成为这个时期教育评价研究和应用的主流。认知诊断理论以“知识结构+认知结构+思维模型”为基础,对认知的形成过程做出诊断和判断,即对教育的过去进行诊断和判断。多维项目反应理论则是对多重显性能力测量并对学生的未来发展做出诊断与预测,即对教育未来进行诊断和判断。

    第四代教育评价提出了这样几个观点,不认为用管理的思想来评价学生和教师是优化的,不认为评价在没有师生参与的情况下是合格的,评价的有效性应该体现在参与评价各方的共同“协商”,主张用“全面参与、共同协商、积极回应”的价值观点看待教育评价,即共同建构。这是教育评价的一大进步。《教育部关于推进中小学教育质量综合评价改革的意见》指出,“对评价内容和关键性指标进行分析诊断,分项给出评价结论,提出改进建议,形成学校教育质量综合评价报告”“要指导学校正确运用评价结果,改进教育教学,发挥以评促建的作用……要逐步将评价结果向社会公布,接受社会监督”。明确要求建立一种回应和全面参与的协商机制。

    目前在部分中小学采用的学业素质与能力评价系统(ACTS)、综合素质能力评价系统(ICTS)、发展潜能评价系统(PCTS),被教育界认可的一个关键原因是,对教育局、学校、教师、学生评价后给出评价报告,由学生、家长、教师、官员等参与积极解读和响应,参与评价的各方都能得到交流、互动,能就不同的问题和困难通过积极的“协商”和“回应”,达成共同建构,采用了第四代教育评价思想、理论和方法。

    2009年,哈佛大学校长组织了400多所高校联合签名,认为标准化考试已不足以承担对学生的评定和预测,掀起所谓“反学术能力评估测试(SAT)运动”。由反对单一的标准化考试开始,全球主要教育国家开始采用了包括“学业水平考试+能力测试+综合素质评价”三位一体的综合评价。在第四代教育评价以后,教育综合评价就开启了从过去以心理测验这种量化研究为主,到量化研究与质性研究并重,再到学生的认知、能力、素养增长,包括各种潜能挖掘、全面综合发展的研究时代。我们称之为“第四代教育评价后”或“第五代教育评价”。我国当前的教育评价改革明确提出育人为本,强调全面、综合和个性化发展,这和国际上关于教育评价的发展追求综合评价是一致的。教育评价改革的目标,不落后于国际上主要教育发达国家。

    教育评价改革是一项巨大的系统工程,要建立指标体系、评价标准、方式方法,还要科学运用评价结果;要协同教学改革、课程改革、育人改革、考试招生制度改革,使之互相配套,否则就会失败。

    2013年启动的教育质量综合评价改革实验,也称作认定性评价,主要是提供管理、考核两种基本功能。2014年《国务院关于深化考试招生制度改革的实施意见》提出了“两依据一参考”模式,综合素质评价开始受到前所未有的重视。2015年正式启动的教育质量监测,明确提出决策性评价改革。教育评价在应用上出现了分化:第一个是决策性评价,即教育质量监测;第二个是认定性评价,即教育质量管理、考核性评价;第三个是服务性评价,即诊断、甄别和教学育人服务。

    教育评价是由教育目标所决定的。现在的教育目标既关注教育的目标和结果,又关注过程与方法、情感与价值等。所谓学科素养,就是把知识、技能、观念、方法提炼为关键能力,把情感、态度、价值观提炼为必备品格。这就要求学业评价改革必须基于“三维目标”或学科素养,这是非常严重的技术挑战。“三维目标”重视知识与方法的形成和过程的评价,可以采用认知诊断理论,通过“知识结构+认知结构+思维模型”的测量评价结构,解决针对“三维目标”的学科学习评价问题,形成“三维测量与评价”。测评技术,是影响教育评价发展改革的关键问题。

    (作者系中国教育学会中小学教育质量综合评价办公室副主任)