好研网
博客中心 > 寻求一种可操作的增值评价模式 ——把国际经验转化为本土实践

寻求一种可操作的增值评价模式 ——把国际经验转化为本土实践

发布时间:2014-02-01 16:23:00 作者:674311 浏览次数: 评论:7 分享

寻求一种可操作的增值评价模式

——把国际经验转化为本土实践

 

 

发达国家特别是美国十分重视学校的教育质量,建立了严格的绩效责任制。自20世纪90年代以来,美国政府和教育界谈得最多的就是教育绩效责任,逐步建立起更加富有成效、操作性强的绩效责任制推动教育质量提高。

最近几十年来,世界主要发达国家在教育评价方面开展了积极的探索,形成了多种多样、广泛应用的模式,积累了丰富的经验。

评价的观念由来已久,实际上早在公元前2000年,中国已经有一套发挥很大作用的文官评价制度。评价的概念也有悠久的历史,而且定义也多种多样,评价在对于不同的人和不同的情景意义各异。评价是测试、描述、资料利用和管理的同义语,教育评价的定义已经多种多样,但直到1981年“教育评价标准联合委员会”(the Joint Committee on Standards for Education Evaluation)提出广泛的定义:“对某一对象的价值和优点的系统调查”。[1]

美国把长期未能有效对学生实施教育教学,以使学生达到规定的学业标准和要求的学校称为“失败学校”(falling schools),或成绩低下学校(low-performing schools)。1997年美国已经有22个州通过了相当于“学校破产法”(Academic Bankruptcy Laws)的立法,明确了州有权对那些学生成绩持续低下的学校即“失败学校”或学区进行干预。1994年美国《初等和中等教育法》再授权规定了严格的绩效责任标准。

 

 

一、教育评价在美国的实践

(一)20世纪美国教育评价模式的探索——从NAEP到Value-Added模式

20世纪60年代,美国创建了一个全国性的教育评价项目——“全国教育进步评价”(National Assessment of Educational Progress,NAEP),1969年实施了第一次NAEP。由于成本、政治合法性、对误用评价结果的担心等因素,NSEP设计有意识地使州和地方之间的数据不可比较。

到80年代,田纳西州州长拉玛尔·亚历山大领导的NAEP研究小组认识到最重要的教育决策是由州和地方做出的,教育绩效责任也相应地交给州和地方。因而提议把全国笼统的教育评价数据变得可以在州与州之间、地方与地方之间进行比较。州和地方的决策者也能从可比较的数据中受益,从而做出更好的教育决策。[2]

NAEP在80年代的变革吸引了政策制定者,使NAEP变成了“国家成绩单”(Nation’s Report Card)。90年代早期,NAEP取得两项重要进展。一是使成绩在州间可比较;二是将成绩划分为初级、熟练和高级三个层次。2002年,美国No Child Left Behind Act (NCLB)通过立法规定,所有各州都要求4年级、8年级每隔一年参加NAEP数学和阅读评估。这些评估与州和学区的绩效责任联系在一起。随着评估结果直接或间接用于问责的目的,低利害的监控逐渐变为高利害的监控。[3]

2.增值评价模式(Value-Added Modeling,Value-Added analysis, Value-Added Assessment)

增值评价模式也叫增量分析评价或增量评价,其目的是评价学区、学校和教师对学生学习的贡献。增值评价模式是由统计学家桑德斯于上世纪90年代开发的评价技术,田纳西州最先实施增值评价。

增值评价方法基于这样一种假设:通常情况下,学生的成绩大体上与他们在过去数年里的成绩相当,因而可以用学生过去的考试分数设定该生将来的预期考试分数。到时把学生的实际分数与预期分数进行比较,如果实际分数超过预期分数,则教师和学校对学生的贡献大;反之则贡献小。为了保证分数可以跨年度比较,采用标准化的测试方法。将所有学生实际分数和预期分数等信息收集起来,统计学家就可以判断教师对学生的贡献有多大。增值评价的对象是教师和学校,而不是评价学生的天赋能力或社会经济背景。

增值评价在田纳西、宾夕法尼亚、路易斯安那等州进行了实验。2010年,美国一些学区采用增值评价,包括芝加哥公立学校、纽约市教育局、哥伦比亚特区公立学校。增值评价结果被用于决定教师的去留和奖金多少。

增值评价也受到诸多质疑,还需要改进和完善。特别是这种高厉害的评价方式,会影响到教师和学校的行为,导致“应试”的倾向。

    适当年度进步、发展模式、增值评价模式实际上都可以看成是对评价对象进步的确认,都是着眼于评价发展,并且是为促进发展而评价。

 

(二)美国21世纪的教育评价模式

1.基于AYP的发展评价模式

《不让一个孩子掉队》(NCLB)为每个学生的学业水平设定了目标——适当的年度进步(Adequate Yearly Progress,AYP),州和学校在其中扮演重要角色。全美50个州首次制定了各自的附有明确后果的绩效责任计划,其实施成效在马里兰州的一些学校得到了最好的证明。NCLB要求各州采用标准化的评价,以测试AYP。AYP不是一个具体的分数,而是为学校设定的该校学生在某科目上达到既定熟练水平的比例,要求每所学校不断提高这一比例。例如,亚特兰大某小学达到本州阅读标准的人数从2003年至2006年增加了23%;数学上升了34%。它考察的是学校达到熟练标准的学生比例。也可以从另一面来辨别学校的进步,被成为“避风港”(Safe Harbor)模式,它规定如果不熟练的学生比例比上一年降低10%,也可看成学校进步。由此可见,AYP模式的设计思路是相当周密的。避风港模式关注学校提高学习基础相对较差学生的学习成绩,有利于激励学校坚持面向全体学生的发展方向。我省一些学校采取“培优补差”措施,不是仅仅抓少数高分尖子生,而是注重所有学生的发展,着力提高成绩落后学生的学业水平。这些学校的办学理念和工作成果在现有评价模式下不一定得到很好的确认,但是在避风港评价模式下,这些学校的进步将会非常明显。AYP模式也存在一定的缺陷,下面将会谈到。

2.发展模式(Growth model)

发展模式(Growth Model)可以看出是AYP的改进版。2007-08学年,美国教育部开始在9个州实施“发展评价模式试验项目”(the Growth Model Pilot Project,GMPP)。以发展评价模式来测定“适当年度进步”(AYP)对州和学区很有吸引力,因为它在没有足够比例的学生达到熟练标准的情况下也能够证明学校的进步。Growth模式与AYP模式不同,AYP模式是以达到熟练标准的学生比例来判断学校进步的。如果学校里达到熟练标准的学生尚未提高到一定比例,但学生实际上已经取得很大进步,这样的学校在AYP模式下不被认为有进步,但是Growth 模式承认学校的进步。标准的AYP模式是静态评价模式。

Growth模式通过对比纵向记录的学生成绩数据,测度学生在过去一年了成绩提高了多少。它针对的是每一位学生,而不是学校。Growth模式有3种类型。①州平均增长(state average growth):以过去3年州平均学生成绩增长为依据,观察学生当前考试分数,来预测学生未来3年的分数。②学生个人成绩增长(individual student growth):用学生个人过去几年考试分数预测学生未来成绩增长。③分数表(value table):学生通过努力达到熟练标准,将奖励给学校予一定分数值,如某学生上一年是初级水平,今年达到熟练标准,该生将为学校赢得100分奖励。



[1] Steven, Floraline etc.. User-Friendly Handbook for Project Evaluation: Science, Mathematics, Engineering and Technology Education[R].NSF, 1993:10.

[2] Robert L. Linn. State-by-State Comparisons of Student Achievement: The Definition of the Content Domain for Assessment[A]. Center for Research on Evaluation, standard, and Student Testing  Study Group on Pre-Collegiate Education Quality Indictors. Final Report[C]. Center for Study of Evaluation Graduate School of Education University of California, Los Angeles, 1987:Ⅰ-1.

[3] U.S. Department of Education, Office of Planning, Evaluation and Policy Development, Evaluation of the National Assessment of Educational Progress, Study Reports, Washington, D.C., 2009: xi

已到第一张图片了。

重新播放

已到最后一张图片了。

重新播放






评论 已有