高考有两个问题没有解决。一个是分数决定论,其实,在我们测量理论中,大家都知道每一次考分高和低,都有偶然性,尤其是考分越高,越可能有偶然性(统计学上称“回归均值”),测量(testing)原来是进行能力判断或评估(assessment)的一个依据。现在测量取代了评估,变成了能力的代名词,好像靠了98的一定比考97的人好,而实质上他们并没有实质的区别。可是现在好了,不仅高考要排名,中学每门考试也要排名,每一分都要像打仗一样去争。

其实中国的整个教育测评制度违背了教育测评的宗旨。测评本来是对学习成果的取样(sampling),取样的原则是课程标准(standards)和与之相应的教学目标。现在,大家注重的不是这些教育目标是否实现,而是根据往年高考我们怎么准备考试。当备考超过了了解试题的类型和样式,而有意识地攻克考题本身时,测评的取样功能就被歪曲了(这也是美国很不喜欢新东方的原因,因为新东方的方法改变了分数所代表的意义,技术上便是破坏了测试的“效度”validity)。美国大学录取看SAT 或ACT,都是划一条最低分数线,一般比较宽松,即使顶尖大学,也会划在约84-90th percentile, 一个标准差之上或稍强,即百里取十或十五,然后根据其他项目综合评估。这是因为评估的效度取决于评估是否保证学生在学校里的成功,成才(即预测效度,predictive validity),这一点我们知道,不是分数越高越成功。实际上,像哈佛这样的学校对SAT很高但其他方面乏善可陈的申请人基本不录取,而青睐成绩可以,有特长,有想法的。据说中国如果学美国用综合评估,那么开后门难以杜绝。所以为公平起见,虽然有弊端,还是要坚持。我的观点是有这点公平比没这点公平好。其实还有很多隐性和显性的不公,如外省市考北京上海高校,分数要高50-60分,甚至更高,而在中国,高等教育资源又集中在这些中心城市。 这和美国不同,美国的高教学校多,资源分布相对平衡。

另外,中国高考一年一次,也是导致高中恶性竞争的原因之一。美国SAT或ACT都是在毕业前一年开始,可以早考,也可以等到毕业班那年考,一年数次,考砸了再考就是,这样不耽误人。这样做的前提是建立大型题库,需要资源,时间,和专业人员。以中国的人力财力,建立题库没有问题,但中国变化太大,至少像政治题每年都要变,和不同领导人主张什么关系太大,不像美国,你是布什,还是奥巴马,跟大学考试没有什么关系。其次,是试题保密问题,我们这里是临时组织出题团队进行封闭式出题。这样的出题方式,随意性很大。在美国,每道题还要做抽样测试,然后决定是否剔除,或做修改。我的中国同事说,要在中国这样搞,无论保安再好,肯定有人有本事偷题,泄题。嗨,国内的这些事儿,有时让我目瞪口呆。

[ 本帖最后由 David 于 2008-11-19 14:04 编辑 ]
我的回答确实局限于测试的一些技术和运用层面的问题。高考体制引起的连锁反应和效应和整个系统的迅速变形扭曲,是可以成为复杂动态系统研究的教科书案例的。自上而下的刹车命令下得不少了,可是恶性竞争却有愈演愈烈之势。一个学校不卷入这个竞争队伍,马上会面临周围的巨大压力,而且很快被边缘化。

如何解套?(1)首先高考制度方面的改革,(2)中学本身要取消月考(一学期有一个期中考就可以了),年级排名,每学期按排名分班之类加剧竞争的做法。(3) 为此,教育局也应该改变考核校长的方法,尤其不宜设立升学硬指标,(4) 课程上要也要作调整,不要难度太大,让学生自信心备受挫折,也不要搞题海战术,让学生较劲谁更能熬夜。(5) 也要教育家长:其实学习的关键不是比谁花的时间多,而是谁学得更聪明,更有效;有些学习方式是比课本学习更为有效的。

这些改变都无法单独进行,因为互相牵连。真希望谁能发一个“魔咒”,让体制进入moratorium状态,然后大家坐下来,看看到底怎么做好。当然这可能有点像痴人说梦了。不管怎样,如果教育目标是围着老师,家长,校长的升学目标转而学生本生被看作是达到目的的对象和手段,而不是教育活动的主体,成功只是老师的成功,家长的成功,校长的成功,而未必是学生的成功。在我们的体制中,学生基本没有话语权,所以,用零分来发泄一下,应该能理解。