[转帖]中美教育测量评估比较:高校入学考试

中美教育测量评估比较:高校入学考试

教育与民主漫笔之二

 

禾丁

(首发于新世纪网11/14/2005)

在上一篇文章(中美义务教育经费对比-新世纪5-30-2005)笔者指出,义务教育的实施与发展完全是由政府行为决定的。上文从实施义务教育的三个条件:教育经费保障,政策立法保证,执法机构支持出发,指出了中央和各级政府的所作所为是导致中国教育经费的严重不足的根本原因,从而阐明中国的政治体制是执行与发展义务教育的最大障碍。

本文将分析中国政府的另一教育政策:高校入学考试制度。本文以教育测量科学理论为依据,对高考的目的,考试内容和考试制定过程进行分析,通过与民主制度下义务教育的考试制度进行对比,对中国高考制度进行批判。从而指出中国高考制度与义务教育背道而驰,严重地阻碍了义务教育的执行和发展。

本文将分析中国政府的另一教育政策:高校入学考试制度。本文以教育测量科学理论为依据,对高考的目的,考试内容和考试制定过程进行分析,通过与民主制度下义务教育的考试制度进行对比,对中国高考制度进行批判。从而指出中国高考制度与义务教育背道而驰,严重地阻碍了义务教育的执行和发展。

中国的高考几乎牵动中国的每一个考生家庭,决定了政府教育政策的走向。如果政府确实要摆对高考的位置,向先进国家看齐,必然会使用最新的教育科学理论指导高考的每一个环节,利用后发优势。可是,令人奇怪的是,至今为止,教育部对测量科学理论始终是无动于衷。全无发射卫星,夺取奥运会金牌,那种赶超世界水平的劲头。那么,教育测量到底有无科学理论可循,其他国家又是如何制定大学入学考试的呢?

中国的高考几乎牵动中国的每一个考生家庭,决定了政府教育政策的走向。如果政府确实要摆对高考的位置,向先进国家看齐,必然会使用最新的教育科学理论指导高考的每一个环节,利用后发优势。可是,令人奇怪的是,至今为止,教育部对测量科学理论始终是无动于衷。全无发射卫星,夺取奥运会金牌,那种赶超世界水平的劲头。那么,教育测量到底有无科学理论可循,其他国家又是如何制定大学入学考试的呢?

在上世纪七十年代起,高等数学的模式在被经济领域成功运用之后,进入了教育心理测量理论,从而对原有的传统测量理论中薄弱的部分有了划时代的突破,创造了一种新的理论“Item Response Theory",国内翻成“特质理论”,以下简称为IRT理论。在测量技术方面,新的理论所创建的先进的科学测量手段比较成功地解决了传统的测量方式存在的技术弊端,使得标准化考试,试题库建立,计算机考试程序的实施成为可能,教育心理测量的客观性、公平性达到了新的水平。从而为以公正为灵魂的义务教育提供了有效的工具来检验教育质量。于是标准化考试开始被大量的用于教育政策的决定,这对评价学校,评价教学质量都起了越来越重要的作用。

在上世纪七十年代起,高等数学的模式在被经济领域成功运用之后,进入了教育心理测量理论,从而对原有的传统测量理论中薄弱的部分有了划时代的突破,创造了一种新的理论“Item Response Theory",国内翻成“特质理论”,以下简称为IRT理论。在测量技术方面,新的理论所创建的先进的科学测量手段比较成功地解决了传统的测量方式存在的技术弊端,使得标准化考试,试题库建立,计算机考试程序的实施成为可能,教育心理测量的客观性、公平性达到了新的水平。从而为以公正为灵魂的义务教育提供了有效的工具来检验教育质量。于是标准化考试开始被大量的用于教育政策的决定,这对评价学校,评价教学质量都起了越来越重要的作用。

那么科学测量理论到底有什么特点呢?

那么科学测量理论到底有什么特点呢?

一.它建立和完善了测量理论的两个原则:信度与效度的检验理论,并提供以数学模式为基础的检验手段与检查标准。

二.对考试的公正性、公平性运用了可定性、定量的数学表达形式,形成了一种严谨的测量科学。

三.理论与实际的结合。先进的数学模式与统计方法用于考试的全过程,包括考题的制定,试题选择,学科考试的制定、考试的评分与汇报,等。从而保证了考试过程科学化与规范化。

四.将计算机运用于考试编制过程,开发利用了一系列的检测试题模式的软件。将这些理论用于实际操作,有效地提高了教育和心理测量的客观性与准确性。随着计算机的普及,有效地提高了标准化考试质量,扩大并发展了考试的类型与范畴。(Item Response Theory,Ronald K.Hambleton,page 5)

目前, 教育心理测量理论在实践中得到广泛运用。在很多国家,政府部门如若要使用考试来作为任免标准,首先要求使用方必须遵循测量原则,不得擅自编制考试。必须使用标准化考试。而制作考试的公司或组织,也必须严格遵守测量理论的原则来操作。当考试公司公开发布其制定的考试的同时,必须公布制作过程的技术汇报,就如同任何工业产品要有质量保证书一样。在技术汇报里,必须公布检验效度信度的全过程与所达到的技术指标。事实证明,运用科学的测量理论可以编制合格的标准化考试,包括常模参照与标准参照性考试。测量理论可以用来检验考试题目的偏差性(即群体歧视,是指有的题目对某些群体容易而对其他群体难,从而造成对某些群体的非公正性),考试内容的对等性(不同的考试之间的内在联系),以及对考试结果的评价汇报,等等。(Yan,1983,Pandey & Carlson,1983,Guion & Ironson,1983,Item Response Theory, Ronald K.Hambleton p.8)

目前, 教育心理测量理论在实践中得到广泛运用。在很多国家,政府部门如若要使用考试来作为任免标准,首先要求使用方必须遵循测量原则,不得擅自编制考试。必须使用标准化考试。而制作考试的公司或组织,也必须严格遵守测量理论的原则来操作。当考试公司公开发布其制定的考试的同时,必须公布制作过程的技术汇报,就如同任何工业产品要有质量保证书一样。在技术汇报里,必须公布检验效度信度的全过程与所达到的技术指标。事实证明,运用科学的测量理论可以编制合格的标准化考试,包括常模参照与标准参照性考试。测量理论可以用来检验考试题目的偏差性(即群体歧视,是指有的题目对某些群体容易而对其他群体难,从而造成对某些群体的非公正性),考试内容的对等性(不同的考试之间的内在联系),以及对考试结果的评价汇报,等等。(Yan,1983,Pandey & Carlson,1983,Guion & Ironson,1983,Item Response Theory, Ronald K.Hambleton p.8)

同时必须指出义务教育,尤其是美国的义务教育发展, 对于科学测量理论的发展起了决定性的推动作用。义务教育产生以来,教育的平等、公正性成为民主制度的重要组成部分。义务教育的目的是为了让受教育的学生都得到同等水平的教育,因此考试的功能决定了其不仅仅检验了学生个人的学习效果,从而了解受教育的孩子是否达到了学习标准,考试成绩还被用来检验学校或者教师是否贯彻执行了教育目的。义务教育是公众事业,考试结果必然成为公众信息。考试公平性、公正性成为至关重要的因素。考试的结果公平,公众的评判结果才能公正。教师与学生也可以根据考试结果找出学习成功或失败的原因。防止互相推逶责任。可见考试对义务教育有着举足轻重的作用。

同时必须指出义务教育,尤其是美国的义务教育发展, 对于科学测量理论的发展起了决定性的推动作用。义务教育产生以来,教育的平等、公正性成为民主制度的重要组成部分。义务教育的目的是为了让受教育的学生都得到同等水平的教育,因此考试的功能决定了其不仅仅检验了学生个人的学习效果,从而了解受教育的孩子是否达到了学习标准,考试成绩还被用来检验学校或者教师是否贯彻执行了教育目的。义务教育是公众事业,考试结果必然成为公众信息。考试公平性、公正性成为至关重要的因素。考试的结果公平,公众的评判结果才能公正。教师与学生也可以根据考试结果找出学习成功或失败的原因。防止互相推逶责任。可见考试对义务教育有着举足轻重的作用。

当今世界,民主制度日益深入人心,寻求社会的公平、公正成为人类发展的重要目标,各国都在争先恐后地采用新的科学理论与技术来推动民主化在本国的发展,在这样的大环境中,测量理论与实践的推广也更是日新月异。考试作为一个产业,在中国很多领域里得到了迅猛发展。如英语等级考试,计算器技能考试等。然而,上述一切对中国学校里的考试,尤其是对高校招生考试却没有发生影响。高考自从77年恢复以来,一直是演习老路,因循守旧,故步自封。真是一个顽固的堡垒。不仅如此,教育界还有很多人在为现今的高考唱赞歌。

当今世界,民主制度日益深入人心,寻求社会的公平、公正成为人类发展的重要目标,各国都在争先恐后地采用新的科学理论与技术来推动民主化在本国的发展,在这样的大环境中,测量理论与实践的推广也更是日新月异。考试作为一个产业,在中国很多领域里得到了迅猛发展。如英语等级考试,计算器技能考试等。然而,上述一切对中国学校里的考试,尤其是对高校招生考试却没有发生影响。高考自从77年恢复以来,一直是演习老路,因循守旧,故步自封。真是一个顽固的堡垒。不仅如此,教育界还有很多人在为现今的高考唱赞歌。

在最近的一期教育权威杂志上,发表了一组高层教育人士的题为“高考改革:完善制度,依法治考,凸显公平,走向多样”的笔谈(下文简称“笔谈”)。文章编者按一开始就定了调:全国统一高考制度因其所具有的权威性,科学性,高效性等方面的优点,在为高校选拔优秀新生,促使青少年努力学习,鼓励公平竞争,维护社会稳定等方面起到了重大的作用。(“高考改革:完善制度,依法治考,凸显公平,走向多样”《教育研究》2005年第三期, p.29-37.)

在最近的一期教育权威杂志上,发表了一组高层教育人士的题为“高考改革:完善制度,依法治考,凸显公平,走向多样”的笔谈(下文简称“笔谈”)。文章编者按一开始就定了调:全国统一高考制度因其所具有的权威性,科学性,高效性等方面的优点,在为高校选拔优秀新生,促使青少年努力学习,鼓励公平竞争,维护社会稳定等方面起到了重大的作用。(“高考改革:完善制度,依法治考,凸显公平,走向多样”《教育研究》2005年第三期, p.29-37.)

不用说在编者的安排下,这一组“笔谈”当然不会偏离他们早已预先定下的大方向,於是,无论他们在何等的位置,学得是何等专业,对高考的认识了解多少,都对高考做了肯定,即使有人提出要改革,也是说得不痛不痒,顾左右而言它,根本不谈实质性问题。

为了对高考的本质有一个清楚地了解,本文将对高考中的实质性问题提出异议。要讲清楚,中国高考是否具有公平性?“笔谈”中有文解释了为什么高考是公平的。文章在高度评价了历史上的选拔人才的科举考试的公平性后,说“统一高考之建立,除效益和质量的考虑之外,更有追求公平之本源因素。统一考试正是从制度上排除了考试之外的人为因素的干扰,有效的保证了考试的公平与健康发展,使全体国民享有平等参与接受高等教育和追求社会地位竞争的机会。(郑若玲,厦门大考试研究中心副主任,《教育研究》2005年第三期, p.37)。然而现代测量科学对考试是否公正公平是有一整套检验标准的。本文将用这些标准原则来检验高考的“公平性,科学性,权威性,高效性”。 

为了对高考的本质有一个清楚地了解,本文将对高考中的实质性问题提出异议。要讲清楚,中国高考是否具有公平性?“笔谈”中有文解释了为什么高考是公平的。文章在高度评价了历史上的选拔人才的科举考试的公平性后,说“统一高考之建立,除效益和质量的考虑之外,更有追求公平之本源因素。统一考试正是从制度上排除了考试之外的人为因素的干扰,有效的保证了考试的公平与健康发展,使全体国民享有平等参与接受高等教育和追求社会地位竞争的机会。(郑若玲,厦门大考试研究中心副主任,《教育研究》2005年第三期, p.37)。然而现代测量科学对考试是否公正公平是有一整套检验标准的。本文将用这些标准原则来检验高考的“公平性,科学性,权威性,高效性”。 

考试目的

利用科学测量理论制定考试,首先必须有一套明确的考试目的。只有具有公平合理的考试目的,才有可能制定公平合理的考试。中国高考的目的明确吗?教育部高校学生司司长林惠青在文章中说:高考要遵循“四个有助于”的原则:1。高校培养高素质的专门人才和拔尖人才,2。推进中学实施素质教育,3。高校办学自主,4。高考科学,公平,安全,高效。(《教育研究》2005年第三期 p.32)

利用科学测量理论制定考试,首先必须有一套明确的考试目的。只有具有公平合理的考试目的,才有可能制定公平合理的考试。中国高考的目的明确吗?教育部高校学生司司长林惠青在文章中说:高考要遵循“四个有助于”的原则:1。高校培养高素质的专门人才和拔尖人才,2。推进中学实施素质教育,3。高校办学自主,4。高考科学,公平,安全,高效。(《教育研究》2005年第三期 p.32)

在这四个原则中,第一条与第二条相互矛盾。一场考试,所能达到的目的有限。很难满足两个相矛盾相对立的目的。如果高考的目的是为高校选拔人才,考试就必须以把考生分化出来为目的制定,从而依据结果可以把学生排列成一种上小下大的金字塔形式,以达到其目的。然而政府第二个目的是推进素质教育。这个目的是以提供同等水平的教育手段, 普遍提高学生素质为目的,考试是用来检查学生的普遍水平,也就是说在正常情况下,大多数学生都会达到考试的要求。这样一来,把学生排列成金字塔的高考就完全不可能达到这一目的。一个考试有两个相对立的目的,能够说目的明确吗,完全不能,只能说目的混淆不清。而正是制造金字塔的高考成了在中国推行素质教育的最大障碍,这二者在目前的情况下是相对立的。从而我们可以看出教育部在公布这四个原则的时候,全然没有从科学的理论出发。

在这四个原则中,第一条与第二条相互矛盾。一场考试,所能达到的目的有限。很难满足两个相矛盾相对立的目的。如果高考的目的是为高校选拔人才,考试就必须以把考生分化出来为目的制定,从而依据结果可以把学生排列成一种上小下大的金字塔形式,以达到其目的。然而政府第二个目的是推进素质教育。这个目的是以提供同等水平的教育手段, 普遍提高学生素质为目的,考试是用来检查学生的普遍水平,也就是说在正常情况下,大多数学生都会达到考试的要求。这样一来,把学生排列成金字塔的高考就完全不可能达到这一目的。一个考试有两个相对立的目的,能够说目的明确吗,完全不能,只能说目的混淆不清。而正是制造金字塔的高考成了在中国推行素质教育的最大障碍,这二者在目前的情况下是相对立的。从而我们可以看出教育部在公布这四个原则的时候,全然没有从科学的理论出发。

首先探讨一下推进素质教育的考试应该是什么样,我们可以借鉴美国的经验,看看他们的考试与教育的关系,从而了解什么样的考试才可以推动教育朝公平合理的方向发展。

首先探讨一下推进素质教育的考试应该是什么样,我们可以借鉴美国的经验,看看他们的考试与教育的关系,从而了解什么样的考试才可以推动教育朝公平合理的方向发展。

制定明确的考试目的是先决条件。在美国,全国没有统一课程与教材,为了取得明确而又统一的教育目标,政府组织专家制定培养学生的一系列标准,然后公布于众,由全民讨论通过从而明确下来。学校再根据这些标准制定教学内容即课程与教学计划。与此同时,考试公司或专业组织用科学的测量方法严格按照这一标准制定考试题,编制考试,对学生掌握知识的程度进行测量。

制定明确的考试目的是先决条件。在美国,全国没有统一课程与教材,为了取得明确而又统一的教育目标,政府组织专家制定培养学生的一系列标准,然后公布于众,由全民讨论通过从而明确下来。学校再根据这些标准制定教学内容即课程与教学计划。与此同时,考试公司或专业组织用科学的测量方法严格按照这一标准制定考试题,编制考试,对学生掌握知识的程度进行测量。

其次,考试立法与标准化:政府制定一系列的详细规定考试的具体制作要求,并公布与众接受公众检验。例如明尼苏达州教育厅公布的中小学统考试题的制定过程简要就包括以下内容(详细见文后附录):

其次,考试立法与标准化:政府制定一系列的详细规定考试的具体制作要求,并公布与众接受公众检验。例如明尼苏达州教育厅公布的中小学统考试题的制定过程简要就包括以下内容(详细见文后附录):

I.规定考试目的:明尼苏达综合性考试-系列二(MCA-II)的目的是测量并记录明尼苏达学生达到明尼苏达学习标准的成绩。同时,MCA-II的结果可以用于调整学校与学区(教育局)的课程,班级考试成绩结果可用于改进课堂教学,同时用纵向追踪结果显示学生群体逐年的进步。

I.规定考试目的:明尼苏达综合性考试-系列二(MCA-II)的目的是测量并记录明尼苏达学生达到明尼苏达学习标准的成绩。同时,MCA-II的结果可以用于调整学校与学区(教育局)的课程,班级考试成绩结果可用于改进课堂教学,同时用纵向追踪结果显示学生群体逐年的进步。

II.制定并公布试题内容细则:规定一系列《试题细则》的主要目的是帮助试题制定者能够在不同的时间范围内保持试题的一致性。《试题细则》具体指明了每一个测试中的主次学科项目,各自在测试中占有的份量,以及他们包含的学科标准与合格标准。另外,《试题细则》提供试题总数,试题类别,以及试题应测的智力水平。《试题细则》还对各个标准,各主次项目的试题应如何制定作出规定或限制。

II.制定并公布试题内容细则:规定一系列《试题细则》的主要目的是帮助试题制定者能够在不同的时间范围内保持试题的一致性。《试题细则》具体指明了每一个测试中的主次学科项目,各自在测试中占有的份量,以及他们包含的学科标准与合格标准。另外,《试题细则》提供试题总数,试题类别,以及试题应测的智力水平。《试题细则》还对各个标准,各主次项目的试题应如何制定作出规定或限制。

III VII是对考试制定程序的规定,如选择测量模式,设定标准,记分方式与分数解释等步骤。    

对比美国州一级的学习标准以及考试制作的要求,可以发现中国提倡的所谓素质教育其实并无确定的标准。当教育部说高考要推进素质教育,是以一个无标准的素质教育为基础的。如果教育部确实要将推行素质教育做为高考目的,他们是有样可仿,有路可循的。然而他们并没有按照以上所说的任何一个环节制定高考。很明显,他们只是打着推进素质教育的幌子,其实根本没有打算付诸实施。

对比美国州一级的学习标准以及考试制作的要求,可以发现中国提倡的所谓素质教育其实并无确定的标准。当教育部说高考要推进素质教育,是以一个无标准的素质教育为基础的。如果教育部确实要将推行素质教育做为高考目的,他们是有样可仿,有路可循的。然而他们并没有按照以上所说的任何一个环节制定高考。很明显,他们只是打着推进素质教育的幌子,其实根本没有打算付诸实施。

既然推行素质教育是谎言,为高校选拔人才这个目的无疑是真的了。然而高考在实现这一目的时做到了公平、合理吗?它是一个科学的高质量的考试吗?本文将运用美国大学入学考试SAT ACT 等考试内容的规定,试题的制作过程,分数的确定及汇报与中国高考进行对比,从而对中国高考的公平性与科学性提出质疑。

既然推行素质教育是谎言,为高校选拔人才这个目的无疑是真的了。然而高考在实现这一目的时做到了公平、合理吗?它是一个科学的高质量的考试吗?本文将运用美国大学入学考试SAT ACT 等考试内容的规定,试题的制作过程,分数的确定及汇报与中国高考进行对比,从而对中国高考的公平性与科学性提出质疑。

考试内容的公平性

这些笔谈的文章个个都说高考的内容是严格按照教育部统一的教学大纲制定的。那么首先请问有何根据说高考的确是“严格限制在中学教学大纲和统编教材之内”?如果教育部确实想这样做,按照目前科学的测量理论的手段,这一目的是完全可以达到的。尤其中国有统一的中小学教科书,统一的教学大纲,考题可以制作得很合理,可以准确地反映大纲与统编教材规定的内容。同时,科学测量理论也可以用来检验高考是否符合大纲,有一系列的指标可以证明考题的覆盖面的合理性。

这些笔谈的文章个个都说高考的内容是严格按照教育部统一的教学大纲制定的。那么首先请问有何根据说高考的确是“严格限制在中学教学大纲和统编教材之内”?如果教育部确实想这样做,按照目前科学的测量理论的手段,这一目的是完全可以达到的。尤其中国有统一的中小学教科书,统一的教学大纲,考题可以制作得很合理,可以准确地反映大纲与统编教材规定的内容。同时,科学测量理论也可以用来检验高考是否符合大纲,有一系列的指标可以证明考题的覆盖面的合理性。

比如美国大学入学考试SAT ACT,就没有像中国的高考那样内容形式总是在变来变去。因为美国教育体制稳定,考试目的明确。其规定此类型的考试的内容主要反映两个方面:学生的基础知识与智力能力。为了达到公平合理,这两种考试的内容与难度是公布于众的。他们是以高中的高级课程为下限,大学的基础课程为上限而定题。而内容的涵盖以及能力的包容是由多层次的专家鉴定并确定的。一旦考试内容确定之后,就定为一个相对稳定的标准。题目的制定,内容难度保持在一定的基础上。如要有变化,考试主办方就提前一年或二年通知考生,详细解释原因,介绍新的内容。如今年SAT 增加了写作考试就是这样运作的。

比如美国大学入学考试SAT ACT,就没有像中国的高考那样内容形式总是在变来变去。因为美国教育体制稳定,考试目的明确。其规定此类型的考试的内容主要反映两个方面:学生的基础知识与智力能力。为了达到公平合理,这两种考试的内容与难度是公布于众的。他们是以高中的高级课程为下限,大学的基础课程为上限而定题。而内容的涵盖以及能力的包容是由多层次的专家鉴定并确定的。一旦考试内容确定之后,就定为一个相对稳定的标准。题目的制定,内容难度保持在一定的基础上。如要有变化,考试主办方就提前一年或二年通知考生,详细解释原因,介绍新的内容。如今年SAT 增加了写作考试就是这样运作的。

虽然市场上有不少帮助学生准备考试的服务。学校却很少用教学时间来复习迎考。因为考试的内容规定明确,大部分学生(无论是公立还是私立学校)只要高中课程学得好,考试就会取得好成绩。即使一次没有考好,一年可以考四次,学生可以把几次中考得最好成绩报给学校。同时SATACT 的分数虽然是大学入学考试,然而并不是大学的唯一录取要求。美国大学的录取标准是一种真正合理的标准。就连参加“笔谈”的一位学者也这么说:“美国大学招生方式,即看高考考分,又看高中成绩,还看社会活动,文体活动,公益义工等德行表现和成长记录,以综合成绩来决定是否录取。从理论上说,这样录取最为全面,更加理想(刘海峰, 《教育研究》2005年第三期, p.29) 有不少学生,即使这两门考试都得到满分,但并不一定能为名校所录取。因为其他方面跟不上去。因而考试真正的作用在于提供一个参照系数。这既降低了考试在入学中的法码,又提高了其他因素对入学的影响力,产生了一个平衡的体系。

虽然市场上有不少帮助学生准备考试的服务。学校却很少用教学时间来复习迎考。因为考试的内容规定明确,大部分学生(无论是公立还是私立学校)只要高中课程学得好,考试就会取得好成绩。即使一次没有考好,一年可以考四次,学生可以把几次中考得最好成绩报给学校。同时SATACT 的分数虽然是大学入学考试,然而并不是大学的唯一录取要求。美国大学的录取标准是一种真正合理的标准。就连参加“笔谈”的一位学者也这么说:“美国大学招生方式,即看高考考分,又看高中成绩,还看社会活动,文体活动,公益义工等德行表现和成长记录,以综合成绩来决定是否录取。从理论上说,这样录取最为全面,更加理想(刘海峰, 《教育研究》2005年第三期, p.29) 有不少学生,即使这两门考试都得到满分,但并不一定能为名校所录取。因为其他方面跟不上去。因而考试真正的作用在于提供一个参照系数。这既降低了考试在入学中的法码,又提高了其他因素对入学的影响力,产生了一个平衡的体系。

相比之下在中国,人们看到的是:中国高考内容日新月异,考试难度也是水涨船高。高考内容一年比一年难,题目一年比一年偏,其难度远远超出正常的普通中学可以承受的教学水平。这一方面证明了高考的内容没有经过科学方法的检验,全然置教学大纲,统编教材规定的水准于不顾。同时也表明高考的公平合理是空话。高考成绩是入大学的唯一凭证,迫使人人想要高分。学校在高考的压力下,不得不把正常的教学放在一边,把精力集中在猜题,背题,搞题海战术。同时中国学校因地区、城乡的差别造成了学校教学条件巨大反差,加上学生家庭经济条件的差别,对学生应对考试的能力产生直接的影响。公平竞争完全成了谎言。最终高考把中国的义务中小学教育引进了死路,学校成了应试的集训班,成了摧残学生的身心发展的地狱。 

相比之下在中国,人们看到的是:中国高考内容日新月异,考试难度也是水涨船高。高考内容一年比一年难,题目一年比一年偏,其难度远远超出正常的普通中学可以承受的教学水平。这一方面证明了高考的内容没有经过科学方法的检验,全然置教学大纲,统编教材规定的水准于不顾。同时也表明高考的公平合理是空话。高考成绩是入大学的唯一凭证,迫使人人想要高分。学校在高考的压力下,不得不把正常的教学放在一边,把精力集中在猜题,背题,搞题海战术。同时中国学校因地区、城乡的差别造成了学校教学条件巨大反差,加上学生家庭经济条件的差别,对学生应对考试的能力产生直接的影响。公平竞争完全成了谎言。最终高考把中国的义务中小学教育引进了死路,学校成了应试的集训班,成了摧残学生的身心发展的地狱。 

试题制作过程的科学性

SAT ACT在制定过程中,无一不通过严格的检验过程。就单从编制考题来说,考试部门预先收集成千上万的考题进行检测。而出题的人根本不会知道也不可能知道自己出的题是否被采用。试题可以来自全国各地,考试公司也可以公开招聘学者编制考题。审查、检验试题是长期永久的任务。这两个考试都有足够数量的,经过科学检验的考题库供应考题。一旦科学的题库建立起来,标准化考试可以根据需要定期举行,既不用担心考题泄露,也不用担心试题的重复。因而考试才能作到一年之内考三到四次。

SAT ACT在制定过程中,无一不通过严格的检验过程。就单从编制考题来说,考试部门预先收集成千上万的考题进行检测。而出题的人根本不会知道也不可能知道自己出的题是否被采用。试题可以来自全国各地,考试公司也可以公开招聘学者编制考题。审查、检验试题是长期永久的任务。这两个考试都有足够数量的,经过科学检验的考题库供应考题。一旦科学的题库建立起来,标准化考试可以根据需要定期举行,既不用担心考题泄露,也不用担心试题的重复。因而考试才能作到一年之内考三到四次。

然而中国高考中最大的困难是保密,这就暴露出其不科学性。一位笔者在谈到让各省自主出高考题时,说“自主命题最突出的问题是考题押中率增高。由於自主命题只从本省挑选命题人员,命题人员和教师互动的概率较之从全国范围挑选命题人员的全国统一命题肯定大,因之,自主命题一方面减少了因一省泄题波及全国的风险,但在另一方面,在抵御高押题率,人情请托和特权干涉等方面,却可能低于全国通一命题。”这段文字说明了一点,当年的高考题可以直接从编考题人的口中得知。这种现象的产生证明了高考命题完全是人为的操作,没有任何科学所言,就象科举考题是皇上所定一样同样是不科学的。

然而中国高考中最大的困难是保密,这就暴露出其不科学性。一位笔者在谈到让各省自主出高考题时,说“自主命题最突出的问题是考题押中率增高。由於自主命题只从本省挑选命题人员,命题人员和教师互动的概率较之从全国范围挑选命题人员的全国统一命题肯定大,因之,自主命题一方面减少了因一省泄题波及全国的风险,但在另一方面,在抵御高押题率,人情请托和特权干涉等方面,却可能低于全国通一命题。”这段文字说明了一点,当年的高考题可以直接从编考题人的口中得知。这种现象的产生证明了高考命题完全是人为的操作,没有任何科学所言,就象科举考题是皇上所定一样同样是不科学的。

若要证明高考科学公平,必须出示证据。就象美国的政府对老百姓那样,公布高考试题制作的过程与合格的指标。这些指标本应是公开的信息告知于天下。可是对于中国老百姓来说,这可能就属于国家机密了。再多问下去恐怕就有刺探考试机密,作弊的嫌疑了。人们即使不相信高考,对高考公平合理有怀疑,也没有选择。在民主国家,象中国高考这样暗箱操作的考试是根本不可能出笼的。而在中国就可以,因为是教育部出的题,教育部是最高的教育权利机构,因此他们可以厚颜无耻地说他们出的题具有高质量,科学性,是最权威的。他们可以不按照国际惯例,不遵循科学。 

若要证明高考科学公平,必须出示证据。就象美国的政府对老百姓那样,公布高考试题制作的过程与合格的指标。这些指标本应是公开的信息告知于天下。可是对于中国老百姓来说,这可能就属于国家机密了。再多问下去恐怕就有刺探考试机密,作弊的嫌疑了。人们即使不相信高考,对高考公平合理有怀疑,也没有选择。在民主国家,象中国高考这样暗箱操作的考试是根本不可能出笼的。而在中国就可以,因为是教育部出的题,教育部是最高的教育权利机构,因此他们可以厚颜无耻地说他们出的题具有高质量,科学性,是最权威的。他们可以不按照国际惯例,不遵循科学。 

高考分数的合理性与科学性

美国大学入学考试SATACT 以及国际通用的标准化考试TOFELGRE,无不采用标准分数汇报成绩。而中国高考分数的确定以及其汇报使用,都是采用以原始分数作为最后成绩。学生得到的成绩汇报是他们在考试中的原始分数,即根据学生在试卷上答对的百分比直接得到的分数。高校以及各省市自治区都是使用原始分数作为录取标准。

美国大学入学考试SATACT 以及国际通用的标准化考试TOFELGRE,无不采用标准分数汇报成绩。而中国高考分数的确定以及其汇报使用,都是采用以原始分数作为最后成绩。学生得到的成绩汇报是他们在考试中的原始分数,即根据学生在试卷上答对的百分比直接得到的分数。高校以及各省市自治区都是使用原始分数作为录取标准。

这二者的区别在于:使用标准分数是试题的测试具有标准参照系的标志。只有通过合理的标准化的过程才可能得到合理的参照模式,正确地解释原始分数所代表的学习水平,对学生考试的结果才有合理的评价。这些环节过程是缺一不可的。使用标准分数汇报考试成绩是国际通用的法则。使用原始分数的不合理性主要表现在无参照系因而造成其不可比较性,不确定性以及不等性,等等。了解使用原始分数的不合理性,是教育测量科学中最基本的常识。教育部官员们难道对这些都全然不知吗?恐怕除了原始分数之外,他们拿不出别的更好的东西了。

其实,各级的教育主管及考试中心的负责人对於这些情况都是心知肚明的。如有一位笔者在写到如何进行高考改革时提出了:“倡导,鼓励各省市加强考试科学化研究和现代化建设,积极研究并利用计算机技术,测量学,统计学等方法进行试题设计和题库建设。”( 林惠青《教育研究》2005年第三期, p.33) 这话说得很内行,一听就知道他对测量理论是了解的。说国内的学者对教育测量理论不了解是不符合实际的。中国在九十年代初出现了一阵测量评估热。各大院校也纷纷开设教育心理测量的学科,有关教科书也出了不少。教育部还成立了督导司。同时,国内大力提倡素质教育,反对应试教育,一时间,可以感受到一种新的氛围。可是,这一切都是仅仅停留在了书本上,口头上,研究中,而无力实施。教育测量理论的传授也有十多年的历史了,这位笔者仍然还只能“倡导,鼓励。难道在全球进入高科技发展的今天,在中国其它的领域都起劲地赶超世界先进水平,而对魂系亿万人家的高考就可以置科学化现代化于不顾吗?可以见得教育部完全是明知故犯,放着科学测量理论不用,而固守过时落后的陈规陋习。 

其实,各级的教育主管及考试中心的负责人对於这些情况都是心知肚明的。如有一位笔者在写到如何进行高考改革时提出了:“倡导,鼓励各省市加强考试科学化研究和现代化建设,积极研究并利用计算机技术,测量学,统计学等方法进行试题设计和题库建设。”( 林惠青《教育研究》2005年第三期, p.33) 这话说得很内行,一听就知道他对测量理论是了解的。说国内的学者对教育测量理论不了解是不符合实际的。中国在九十年代初出现了一阵测量评估热。各大院校也纷纷开设教育心理测量的学科,有关教科书也出了不少。教育部还成立了督导司。同时,国内大力提倡素质教育,反对应试教育,一时间,可以感受到一种新的氛围。可是,这一切都是仅仅停留在了书本上,口头上,研究中,而无力实施。教育测量理论的传授也有十多年的历史了,这位笔者仍然还只能“倡导,鼓励。难道在全球进入高科技发展的今天,在中国其它的领域都起劲地赶超世界先进水平,而对魂系亿万人家的高考就可以置科学化现代化于不顾吗?可以见得教育部完全是明知故犯,放着科学测量理论不用,而固守过时落后的陈规陋习。 

国外高校入学考试

不仅自己不能按照国际惯例制作高考试题,中国执政者甚至大言不惭地说中国的高考是其它国家学习的榜样。在这里必须把这个问题讲清楚。其它国家与地区正在实行或试行的高考与中国的情况是完全不能同一而语的。无论是英,法,加拿大,日本,甚至台湾,这些地方实行统一高考是建立在坚实的普及义务教育的基础上的。他们大都完成了十二年的义务教育,高等教育对于这些国家来说,几乎是义务教育的继续。在这些国家和地区,经过多年努力,已经实现了教育机会均等和教育质量均等,因此运用同一考试即可达到双重目的:高中毕业考试同时也是大学入学考试,二者在这些国家和地区实现了统一。

不仅自己不能按照国际惯例制作高考试题,中国执政者甚至大言不惭地说中国的高考是其它国家学习的榜样。在这里必须把这个问题讲清楚。其它国家与地区正在实行或试行的高考与中国的情况是完全不能同一而语的。无论是英,法,加拿大,日本,甚至台湾,这些地方实行统一高考是建立在坚实的普及义务教育的基础上的。他们大都完成了十二年的义务教育,高等教育对于这些国家来说,几乎是义务教育的继续。在这些国家和地区,经过多年努力,已经实现了教育机会均等和教育质量均等,因此运用同一考试即可达到双重目的:高中毕业考试同时也是大学入学考试,二者在这些国家和地区实现了统一。

比如在台湾,因为教育投入充足,高等学校招生率可达百分之一百二十。完全可以做到符合毕业标准的学生就可以入大学。大学录取就完全没有必要另设考试了。台湾的教育部门反省过去四十八年的大学联考时,指出“联考造成了不正常的升学压力,从而造成畸形的教学,畸形的教学造成文化的失根。一个国家如果大多数的国民只知道在个人的近利和物欲中打拼,这个国家的前途着实堪忧。”。台湾目前已经采用了大学多元入学的方案。抨弃了联考制。(大学入学考试变革的转折点上,“国家政策论坛”第一卷第七期。20019月)

比如在台湾,因为教育投入充足,高等学校招生率可达百分之一百二十。完全可以做到符合毕业标准的学生就可以入大学。大学录取就完全没有必要另设考试了。台湾的教育部门反省过去四十八年的大学联考时,指出“联考造成了不正常的升学压力,从而造成畸形的教学,畸形的教学造成文化的失根。一个国家如果大多数的国民只知道在个人的近利和物欲中打拼,这个国家的前途着实堪忧。”。台湾目前已经采用了大学多元入学的方案。抨弃了联考制。(大学入学考试变革的转折点上,“国家政策论坛”第一卷第七期。20019月)

再则,在那些实行统一高考的国家与地区,他们制定的全国高考大都是严格按照教育测量科学理论来编制考试的。无论是英,法,加拿大,台湾,新加坡,他们都面对公众的监督,对公众负责。中国决策人不要再象井底之蛙那样无知了,以为别国会仿照中国落后的考试制度。倒是有可能国外不会猜想到至今为止名声赫赫的中国的高考,不根据教育测量科学制作试题,还是沿用千年以来的科举考试方式。一旦他们明白了真象,可想而知,国际上的专家学者们该怎么评论中国的教育官员与专家。教育部的大员们难道不觉得汗颜吗?这也许只是杞人忧天,因为,这些笔者说得振振有词:要制定有中国特色的高考制度。这当然就是特色之一。

再则,在那些实行统一高考的国家与地区,他们制定的全国高考大都是严格按照教育测量科学理论来编制考试的。无论是英,法,加拿大,台湾,新加坡,他们都面对公众的监督,对公众负责。中国决策人不要再象井底之蛙那样无知了,以为别国会仿照中国落后的考试制度。倒是有可能国外不会猜想到至今为止名声赫赫的中国的高考,不根据教育测量科学制作试题,还是沿用千年以来的科举考试方式。一旦他们明白了真象,可想而知,国际上的专家学者们该怎么评论中国的教育官员与专家。教育部的大员们难道不觉得汗颜吗?这也许只是杞人忧天,因为,这些笔者说得振振有词:要制定有中国特色的高考制度。这当然就是特色之一。

高考不公平性

用教育部以及代言人的定义所谓公平,就是人人享有平等参与接受高等教育和追求社会地位竞争的机会。如果说这是高考公平的表现,人们可以追根溯源,历史上当统治者要寻求治国人才时,都会敞开大门,让平民百姓都来试一试,给一个机会。如果说仅谈这一点,那么如今的中国高考还不如实行了一千多年的科举考试公平。科举考试是选人当官,类似当今的公务员考试。一旦中举,即可进入官吏阶层,掌管权力。

用教育部以及代言人的定义所谓公平,就是人人享有平等参与接受高等教育和追求社会地位竞争的机会。如果说这是高考公平的表现,人们可以追根溯源,历史上当统治者要寻求治国人才时,都会敞开大门,让平民百姓都来试一试,给一个机会。如果说仅谈这一点,那么如今的中国高考还不如实行了一千多年的科举考试公平。科举考试是选人当官,类似当今的公务员考试。一旦中举,即可进入官吏阶层,掌管权力。

而中国高考是学生争取高等教育机会的考试,学生参加高考是为了获得接受高等教育的权利。这实际上是历史的倒退。中国有史以来学生都有权利为自己挑选高等学府,不管是在历代皇权统治,还是民国时期,只要交学费,有高中毕业文凭,就可以报考大学,而一般情况下只要合乎学校标准,通过各校自定的考试,就可以入学。没有很多困难。即便是在国内编写的中国近代教育史中被骂得一无是处的国民党公民教育,只实行了毕业考试制度。没有统一高考一说(舒新城“中国近代教育史资料”),实际上这是符合教育发展的需要的。目前大多数国家都采取中小学毕业考试来规定或检查学生的基础教育学习水平。

到了五十年代,自从中国采取国家统一的高校入学考试后,极大地限制了公民享受高等教育的权力。更有甚者在一九六七年文革期间,高校停止了正常招生达十年之久。后来,邓小平为了拯救垂危的政局,把文革中单纯靠推荐才能上大学的制度改回凭考试入学。这个模式比赤裸裸的单纯靠人事关系上大学是好了一些。然而也只不过回到文革前的水平。二十多年过去了,教育主管部门没有采取任何措施来改进单纯以分数取人的高考制度,在教育权利公平性上没有向前发展半步。他们不以为耻,反而还为这种落后的水平自吹自擂,说什么分数前面人人平等是最公平合理的。

到了五十年代,自从中国采取国家统一的高校入学考试后,极大地限制了公民享受高等教育的权力。更有甚者在一九六七年文革期间,高校停止了正常招生达十年之久。后来,邓小平为了拯救垂危的政局,把文革中单纯靠推荐才能上大学的制度改回凭考试入学。这个模式比赤裸裸的单纯靠人事关系上大学是好了一些。然而也只不过回到文革前的水平。二十多年过去了,教育主管部门没有采取任何措施来改进单纯以分数取人的高考制度,在教育权利公平性上没有向前发展半步。他们不以为耻,反而还为这种落后的水平自吹自擂,说什么分数前面人人平等是最公平合理的。

必须揭穿所谓分数前面人人平等的高考假面具。分数面前人人平等的不公平在于:国民在受教育水平极其不平等的情况下,用一个官方强行制定的不合理的标准来选拔所谓人才,决定人民取得高等教育的机会。这个制度的不平等可以这样来描述:能取得分数,就可以进入选拔行列了。先不说前面已经指出高考自身存在的种种问题从而造成考试分数本身的不科学、不公正,就来看看那些没有机会参加考试因而没有考试分数的人吧。他们怎么办呢?很明显,他们没有被选拔的机会。这些没有分数的人是谁呢,他们为什么不能得到分数呢?他们正是那些从小学开始就失去受教育机会的人。或者是受到不平等教育的人,比如农民子弟和城市贫民子女。然而他们不能受教育是因为政府把他们应得的受教育的机会给剥夺了。因为在中国,公民受教育的种种不平等是政府一手制造出来的(见本人文章:中美义务教育经费对比-教育与民主漫笔之一 新世纪5-30-2005)。 

必须揭穿所谓分数前面人人平等的高考假面具。分数面前人人平等的不公平在于:国民在受教育水平极其不平等的情况下,用一个官方强行制定的不合理的标准来选拔所谓人才,决定人民取得高等教育的机会。这个制度的不平等可以这样来描述:能取得分数,就可以进入选拔行列了。先不说前面已经指出高考自身存在的种种问题从而造成考试分数本身的不科学、不公正,就来看看那些没有机会参加考试因而没有考试分数的人吧。他们怎么办呢?很明显,他们没有被选拔的机会。这些没有分数的人是谁呢,他们为什么不能得到分数呢?他们正是那些从小学开始就失去受教育机会的人。或者是受到不平等教育的人,比如农民子弟和城市贫民子女。然而他们不能受教育是因为政府把他们应得的受教育的机会给剥夺了。因为在中国,公民受教育的种种不平等是政府一手制造出来的(见本人文章:中美义务教育经费对比-教育与民主漫笔之一 新世纪5-30-2005)。 

高等教育专制

政府在掌握了国家的财政大权之后,对公共利益投入甚少,对实行义务教育的九年基础教育投入不到一半,造成了普通老百姓尤其是农民子女受教育危机。然而国家却投入了巨资于高等教育。从而造成了中国之怪现象,即高等教育完全是国家包办,制造了中国有史以来从未有过的高等教育专制统治。

政府在掌握了国家的财政大权之后,对公共利益投入甚少,对实行义务教育的九年基础教育投入不到一半,造成了普通老百姓尤其是农民子女受教育危机。然而国家却投入了巨资于高等教育。从而造成了中国之怪现象,即高等教育完全是国家包办,制造了中国有史以来从未有过的高等教育专制统治。

高等教育远远不同于基础教育,其办学条件之高,经费支出之大决不是单靠政府税收能够承担得起的。几乎所有的国家都是两条腿走路,民办与公办并行。这就是为什么在美国以及大多数发达国家,义务教育只覆盖中小学,政府多半不对高等教育直接投入的原因。举世闻名的美国常青藤大学都是私立,费用来自学费与私人基金会投资。学校有独立的招生办公室。制定自己的招生标准。各个学校根据自己专业的需要掌握录取标准尺度。而这些标准都体现宪法的公正、平等原则,有法可依。一旦有不合法的行为出现,任何人都可以状告学校。国家从不用行政命令手段来直接干涉高校的权力。

高等教育远远不同于基础教育,其办学条件之高,经费支出之大决不是单靠政府税收能够承担得起的。几乎所有的国家都是两条腿走路,民办与公办并行。这就是为什么在美国以及大多数发达国家,义务教育只覆盖中小学,政府多半不对高等教育直接投入的原因。举世闻名的美国常青藤大学都是私立,费用来自学费与私人基金会投资。学校有独立的招生办公室。制定自己的招生标准。各个学校根据自己专业的需要掌握录取标准尺度。而这些标准都体现宪法的公正、平等原则,有法可依。一旦有不合法的行为出现,任何人都可以状告学校。国家从不用行政命令手段来直接干涉高校的权力。

同时美国的公立高等院校多是为平民百姓开办,比如说社区大学,技术专科大学,州立大学,这些大学有一部分资金来自地方税收,也有一部分靠学费支付。然而对比起世界一流的常春藤大学,或者私立大学,他们的学费要低得多,如果是本州居民,所交学费只有私立大学的半数或四分之一。这种高教体制满足了各种群体接受高等教育的需要。所不同的是,一般州立大学都将学费维持在中等以下收入的家庭与个体可以承受的水平上。另外,政府还采取各种办法帮助贫困家庭子女或弱势群体的入学。总之,政府对于教育的责任是最大限度地提供平民受教育包括高等教育的机会,尤其是弱势群体,从而保障社会的公正与平等。

同时美国的公立高等院校多是为平民百姓开办,比如说社区大学,技术专科大学,州立大学,这些大学有一部分资金来自地方税收,也有一部分靠学费支付。然而对比起世界一流的常春藤大学,或者私立大学,他们的学费要低得多,如果是本州居民,所交学费只有私立大学的半数或四分之一。这种高教体制满足了各种群体接受高等教育的需要。所不同的是,一般州立大学都将学费维持在中等以下收入的家庭与个体可以承受的水平上。另外,政府还采取各种办法帮助贫困家庭子女或弱势群体的入学。总之,政府对于教育的责任是最大限度地提供平民受教育包括高等教育的机会,尤其是弱势群体,从而保障社会的公正与平等。

而中国的现实完全相反。自1949年以来,在政府教育专权的控制下,中国砍掉了占全国大学40%的非政府大学,造成了今天各级学校都太少的现象。即使是在所谓的改革开放以后,教育部在一手独揽教育大权的同时,还制定了各种规章条文千方百计地限制其他方式的民营办学。1997年“社会力量办学条例”第五条明确规定:“国家严格控制社会力量举办高等教育机构”。因为学校短缺,为了控制大学生入选,对高校的录取采取了科举试招生方式,造成了只有中了“举”,才能受大学教育。这一条政策的不公平不合理可以说是前无古人的

而中国的现实完全相反。自1949年以来,在政府教育专权的控制下,中国砍掉了占全国大学40%的非政府大学,造成了今天各级学校都太少的现象。即使是在所谓的改革开放以后,教育部在一手独揽教育大权的同时,还制定了各种规章条文千方百计地限制其他方式的民营办学。1997年“社会力量办学条例”第五条明确规定:“国家严格控制社会力量举办高等教育机构”。因为学校短缺,为了控制大学生入选,对高校的录取采取了科举试招生方式,造成了只有中了“举”,才能受大学教育。这一条政策的不公平不合理可以说是前无古人的

 

即便如此,中国仍旧不惜用国家的财力来办所谓世界一流的大学。当然获益者是一小部分所谓的精英人才。中国连九年的义务教育都没钱办,怎么可能有钱为大多数人提供高等教育,甚至是世界一流的高等教育呢?由此可见,政府没有打算让平民百姓享受这种权利,而是想方设法地来限制人民的权利。他们长期以来用培养国家高级人才为理由,把应该投入到基础教育上的财政收入来办大学,甚至不惜重金攀比于国外的贵族高等学院,在那里培养中国特权阶层的接班人。这才是执政党的真正目的。为了达到这个目的,他们可以长期置广大的民众上不起小学于不顾,长期地欺骗中国老百姓。面对如此不平等的教育环境条件,学生无力进入高考的考场参加竞争,请问公平在何处?平等又在哪方?

参加“笔谈”的学者还谈到各省自主招生不可靠,各校自主招生也不可行,为什么在别的国家行得通,都可行的东西到中国就都不可行了呢?很简单,别的国家多数是民主制度,有法可依,有章可循,各地方,各大学自主招生几十年都相安无事。而在中国,哪怕是地方官员,哪怕是高校领导,他们都不愿意看到权力交到别人手中。因为,维持高校专制,就是维持他们手中的权力和利益,一旦权力不在他们的手中,他们的利益就不安全了,就得不到保证了,就不可靠了,就不方便了。中央教育部怎么能够轻易地就把权力下放给各省地区,高校呢。

如果教育部愿意取消高校专制,放手让高校行使自己的权力,把国家的财力全力以赴地放在义务基础教育上,确保教学大纲在中小学校得到彻底实现,那么首先,就得彻底改变高考这个指挥棒。只要高考的指挥棒不存在了,教育的其它方面就可以搞活了,义务教育就可以纳入素质教育的轨道,严格为培养合格的初中高中毕业生而努力。而学生也可以根据自己的条件,择校或选择专业。大学与中小学教育可以建立起正常的关系,高等院校就可以从高中毕业生中选出合乎大学专业需要的学生。

如果教育部愿意取消高校专制,放手让高校行使自己的权力,把国家的财力全力以赴地放在义务基础教育上,确保教学大纲在中小学校得到彻底实现,那么首先,就得彻底改变高考这个指挥棒。只要高考的指挥棒不存在了,教育的其它方面就可以搞活了,义务教育就可以纳入素质教育的轨道,严格为培养合格的初中高中毕业生而努力。而学生也可以根据自己的条件,择校或选择专业。大学与中小学教育可以建立起正常的关系,高等院校就可以从高中毕业生中选出合乎大学专业需要的学生。

     呵呵,文章可真长啊。

     越重视考试,就越是强调考试的科学性,而考试的科学性又反过来成为考试是唯一科学的鉴定标准的理由。但实践证明,考试从来就没有考出真实的能力水平,更不可能考出人才的素质结构和品德。

     另一个方面,考试可以从考试学、教育测量学或心理学测量学的角度去研究,但无论怎样研究都只能是针对测量工具,而无法涉及考试的具体内容——即知识本身。不是任何知识都能考试的,而不能考的知识往往是更重要的知识。这是从测量学角度无非看到的,要理解这一点,需要知识论基础。

[此贴子已经被作者于2006-7-18 17:35:50编辑过]

吃的是草,吐出来的也是草。
欢迎安宁![em23][em27]

谢谢版主的支持。很喜欢真名网的文章。也希望能多听到不同意见。转贴的文章是长了一些,但是文风比较正。希望网友们能耐下性子,读完它。文章试图说明的是考试不只是一个技术上的问题,关键的是在一个不同的制度下,同样的一门学问,可以被操作出完全不同的结果。希望能从根本上去考虑。

谢谢!

安宁客气:)

这篇文章挺有启发性的,让我觉得单纯地讨论考试制度是没有多大意义的,教育精神、人文设想以及制度理念才是重要的革新环节。

以后若遇到比较长的文章,可以根据小标题或者段意把它分为几个部分,依次贴在主帖以及回帖中,若文字太小,可以在编辑框里改变一下字号。

真名就是一方精神家园,愿你在这里玩得愉快[em44]

以下是引用安宁在2006-7-19 10:40:00的发言:

谢谢版主的支持。很喜欢真名网的文章。也希望能多听到不同意见。转贴的文章是长了一些,但是文风比较正。希望网友们能耐下性子,读完它。文章试图说明的是考试不只是一个技术上的问题,关键的是在一个不同的制度下,同样的一门学问,可以被操作出完全不同的结果。希望能从根本上去考虑。

谢谢!

       我觉得,能用一句话说明的问题,没必要洋洋洒洒写一篇文章出来。正如安宁先生指出的,我确实没有看完它。这是因为,我把教育类的文章分成三种,第一种是一看标题就知道不值得看的,第二种是看了几段就知道不值得看的,第三种是可以从头读到尾的。这篇文章属于我认为的第二种类型。也就是看了前几段,就可以发现明显的逻辑错误因而可断定不值得再看的。觉得安宁先生的评价非常到位,这篇文章的优点是文风比较正,作者的态度还是端正的。

      补充一句,中国教育类的论文,属于我说的第一类的文章大约80%,属于第二类的大约15%,属于第三类的大约5%

[此贴子已经被作者于2006-7-19 21:12:26编辑过]

吃的是草,吐出来的也是草。
以下是引用边走边唱在2006-7-19 11:01:00的发言:

安宁客气:)

这篇文章挺有启发性的,让我觉得单纯地讨论考试制度是没有多大意义的,教育精神、人文设想以及制度理念才是重要的革新环节。

以后若遇到比较长的文章,可以根据小标题或者段意把它分为几个部分,依次贴在主帖以及回帖中,若文字太小,可以在编辑框里改变一下字号。

真名就是一方精神家园,愿你在这里玩得愉快[em44]

谢谢指教。在发帖的技术上还是新手,以后再用你教的办法来试。

很高兴此文对你能有启发。现在我们不是都在上下求索吗?不想放过新的见解,能让人的思考的东西。有人在思考,就有办法,中国人是很智慧的民族。不会想不出道理来的。就怕不思考。盲目地活着。

以下是引用乌龙茶在2006-7-19 19:08:00的发言:
以下是引用安宁在2006-7-19 10:40:00的发言:

谢谢版主的支持。很喜欢真名网的文章。也希望能多听到不同意见。转贴的文章是长了一些,但是文风比较正。希望网友们能耐下性子,读完它。文章试图说明的是考试不只是一个技术上的问题,关键的是在一个不同的制度下,同样的一门学问,可以被操作出完全不同的结果。希望能从根本上去考虑。

谢谢!

       我觉得,能用一句话说明的问题,没必要洋洋洒洒写一篇文章出来。正如安宁先生指出的,我确实没有看完它。这是因为,我把教育类的文章分成三种,第一种是一看标题就知道不值得看的,第二种是看了几段就知道不值得看的,第三种是可以从头读到尾的。这篇文章属于我认为的第二种类型。也就是看了前几段,就可以发现明显的逻辑错误因而可断定不值得再看的。觉得安宁先生的评价非常到位,这篇文章的优点是文风比较正,作者的态度还是端正的。

      补充一句,中国教育类的论文,属于我说的第一类的文章大约80%,属于第二类的大约15%,属于第三类的大约5%


很想知道你所指的此文中的逻辑错误是什么。我倒是觉得文章的后半部分比前面的测量过程比较更有意义。前半部分基本上是从测量理论的角度来说明中国测量实际操作中的问题。而后半部分是讲了问题的本质。不知你同意不?

 

强烈同意乌龙茶的观点。

测量的东西嘛,没有心理实验保证的话,很快就失去活力了。

大树就是个广济寺旁穷扫地的.
IRT应该翻译成项目反应论,写这篇原文的人真是不学无术!
大树就是个广济寺旁穷扫地的.

安宁先生:

这篇文章确实有很多问题。本来这种文章我是看不下去的,但你让我指出它有何错误,我不得不再多看几眼。

原文第二段说:“本文将分析中国政府的另一教育政策:高校入学考试制度。本文以教育测量科学理论为依据,对高考的目的,考试内容和考试制定过程进行分析,通过与民主制度下义务教育的考试制度进行对比,对中国高考制度进行批判。从而指出中国高考制度与义务教育背道而驰,严重地阻碍了义务教育的执行和发展”。

简评:以所谓“教育测量科学理论”为依据,分析高考的目的、内容,这是有问题的说法。Psyzjs先生在9楼提到测量应以心理实验为依据,因为心理测量如果没有心理学理论和实验作为依据,那么它只是一种纯工具性的技术,这种技术可以在数学上非常“科学”,但它并不解释心理活动的成因,所以它本身不构成心理分析的依据,而必须以心理学理论和实验成果为依据,测量结果才是可解释的。

用于考试的教育测量技术实际上是借鉴了心理测量技术。但教育测量不像心理测量那样有其独特的理论背景和实验成果,教育测量大致有两类,一类是针对个体心理活动的内容的,这种教育测量其实就是心理测量,或者准确地说,是以心理测量为依据的。刚刚讲到,心理测量有心理学理论和实验作为依据,当教育测量运用某个现成的心理测量技术时(例如智力测验或人格测验),它往往忽略了支持这种心理测量技术的心理学理论和实验成果,由于国内一些搞教育的人往往心理学素养不够,他们只是简单的拿来主义,结果是犯了严重的科学错误自己还不知道,而这常成为心理学专业人士的笑柄。教育测量的另一类是技术性的,例如考试,它在测量技术手段的分析方面与心理测量几乎没什么不同(这方面的不同仅在于心理测量的技术要复杂得多)。之所以说它是技术性的,是因为这类教育测量与测量学的关系仅仅是技术性的,正如心理测量如果没有心理学理论和实验成果为依据,它什么也不能解释一样。以高考为例,在制作高考试题时,当要考虑高考试题的信度、效度、区分度、难度时,确实需要运用测量理论和技术,但是这种运用仅仅是技术性的,比如为了保证试卷有一定的难度,我们可以出一些较难的题目,但什么是难的题目?这个问题不是教育测量学能回答的。试想,如果我不懂物理学但懂教育测量学,现在要出一道物理学题目,要求有一定的难度,我怎么可能出得出来?假定我请物理学教师出了一道难题,考完以后有人问我,可以从这道题目的考分上判断某个考生的物理学知识如何吗?我将无法回答,我能做的仅仅从考分总体上判断某个学生大概处于总体的什么位置上,而无法做任何涉及题目内容的分析,因为我不懂物理学。

那么现在回到这篇文章的第二段,可以问一个问题:“以教育测量科学理论为依据,对高考的目的,考试内容和考试制定过程进行分析”,这种说法合适吗?高考的目的、考试内容,是由教育测量技术决定的吗?如果不是,作者声称要以教育测量科学理论为依据对高考的目的和考试内容进行分析,那不是在缘木求鱼?

以上只是冗长的原文中的一段话,为了说明它的错误,结果我的分析比它的原文还要冗长,这就是我说,如果不是为了要回答你的问题,这种文章我是懒得再看下去的原因。也许大家会觉得,那可能只是一个表述不当,抓住一段话的表述失误推翻全文太霸道了。那我就再举一个例子:

“美国大学入学考试SATACT 以及国际通用的标准化考试TOFELGRE,无不采用标准分数汇报成绩。而中国高考分数的确定以及其汇报使用,都是采用以原始分数作为最后成绩。学生得到的成绩汇报是他们在考试中的原始分数,即根据学生在试卷上答对的百分比直接得到的分数。高校以及各省市自治区都是使用原始分数作为录取标准。”

这也是原文中的一段话,可以这样概括,作者的观点是,高考应该仿效标准测验,应该运用标准分数。

广东省曾是我国第一个运用标准分数汇报高考成绩的省份,所以中国并不都是原始分数汇报。不过这不是主要问题,问题在于,为什么现在仍普遍采用原始分数?是因为教育部的官员不懂标准测验?其实作者应该问一问,标准测验并不是什么神秘的东西,即使我们教育部的官员都是混饭吃的,但他们有那么多专家在身边,专家会给他们提建议,他们怎么可能没听说过标准测验?或者,专家也是混饭吃的?

我想,作者可能不知道,标准分数也是有局限的,尤其是现在各省自己组织高考,并推习“3X”、“32”的考试模式。在心理测量里,标准测验之所以可以普遍采用,一个重要原因是它只有一个量表(包括等值测验),而高考涉及不同的学科,每门学科的考试可以近似地看成是一个量表,不同的量表,也就是不同的考试,结果往往有很大差异。比如,某年数学考试特别难或物理考试特别难,也就是说,如果我们把不同学科的考试看成是一个个的量表,这些量表并不等值,此其一。其二,现在高考允许学生选科目,假定甲选了历史、地理,而乙选了物理、化学,考试以后发现,今年历史和地理普遍考分较高,而物理和化学普遍考分较低,这时,理论上讲,用标准分数比较甲乙是合理的。但是,由于今年选历史和地理的人较多,而选物理和化学的人较少,这就出现一个问题,在这四门学科上,每个学科考生的总体都是不一样的。当四门学科都采用标准分时,由于它们的总体都不一样,而且总体人数差别很大,这时标准分就会严重失真。采用标准分的意义在于不同学科之间可以比较,但当总体差异很大时,四门学科的标准分是没有可比性的,这就是为什么没有采用标准分的原因(有关这个问题,有人做过专门论证,虽然我本人并不完全同意这种论证,但我知道他们有他们的道理)。

以上只是就考试和测量而论,指出作者在分析时的一些错误,正如安宁先生所说,其实这不是原文最主要的观点。但是原文中也有不少重要的表述在我看来属于理论失误,不过这些问题分析起来就更麻烦了,我就不一一指出了。

[此贴子已经被作者于2006-7-21 18:14:21编辑过]

吃的是草,吐出来的也是草。
以下是引用乌龙茶在2006-7-21 13:34:00的发言:

安宁先生:

这篇文章确实有很多问题。本来这种文章我是看不下去的,但你让我指出它有何错误,我不得不再多看几眼。

原文第二段说:“本文将分析中国政府的另一教育政策:高校入学考试制度。本文以教育测量科学理论为依据,对高考的目的,考试内容和考试制定过程进行分析,通过与民主制度下义务教育的考试制度进行对比,对中国高考制度进行批判。从而指出中国高考制度与义务教育背道而驰,严重地阻碍了义务教育的执行和发展”。

简评:以所谓“教育测量科学理论”为依据,分析高考的目的、内容,这是有问题的说法。Psyzjs先生在9楼提到测量应以心理实验为依据,因为心理测量如果没有心理学理论和实验作为依据,那么它只是一种纯工具性的技术,这种技术可以在数学上非常“科学”,但它并不解释心理活动的成因,所以它本身不构成心理分析的依据,而必须以心理学理论和实验成果为依据,测量结果才是可解释的。

用于考试的教育测量技术实际上是借鉴了心理测量技术。但教育测量不像心理测量那样有其独特的理论背景和实验成果,教育测量大致有两类,一类是针对个体心理活动的内容的,这种教育测量其实就是心理测量,或者准确地说,是以心理测量为依据的。刚刚讲到,心理测量有心理学理论和实验作为依据,当教育测量运用某个现成的心理测量技术时(例如智力测验或人格测验),它往往忽略了支持这种心理测量技术的心理学理论和实验成果,由于国内一些搞教育的人往往心理学素养不够,他们只是简单的拿来主义,结果是犯了严重的科学错误自己还不知道,而这常成为心理学专业人士的笑柄。教育测量的另一类是技术性的,例如考试,它在测量技术手段的分析方面与心理测量几乎没什么不同(这方面的不同仅在于心理测量的技术要复杂得多)。之所以说它是技术性的,是因为这类教育测量与测量学的关系仅仅是技术性的,正如心理测量如果没有心理学理论和实验成果为依据,它什么也不能解释一样。以高考为例,在制作高考试题时,当要考虑高考试题的信度、效度、区分度、难度时,确实需要运用测量理论和技术,但是这种运用仅仅是技术性的,比如为了保证试卷有一定的难度,我们可以出一些较难的题目,但什么是难的题目?这个问题不是教育测量学能回答的。试想,如果我不懂物理学但懂教育测量学,现在要出一道物理学题目,要求有一定的难度,我怎么可能出得出来?假定我请物理学教师出了一道难题,考完以后有人问我,可以从这道题目的考分上判断某个考生的物理学知识如何吗?我将无法回答,我能做的仅仅从考分总体上判断某个学生大概处于总体的什么位置上,而无法做任何涉及题目内容的分析,因为我不懂物理学。

那么现在回到这篇文章的第二段,可以问一个问题:“以教育测量科学理论为依据,对高考的目的,考试内容和考试制定过程进行分析”,这种说法合适吗?高考的目的、考试内容,是由教育测量技术决定的吗?如果不是,作者声称要以教育测量科学理论为依据对高考的目的和考试内容进行分析,那不是在缘木求鱼?

以上只是冗长的原文中的一段话,为了说明它的错误,结果我的分析比它的原文还要冗长,这就是我说,如果不是为了要回答你的问题,这种文章我是懒得再看下去的原因。也许大家会觉得,那可能只是一个表述不当,抓住一段话的表述失误推翻全文太霸道了。那我就再举一个例子:

“美国大学入学考试SATACT 以及国际通用的标准化考试TOFELGRE,无不采用标准分数汇报成绩。而中国高考分数的确定以及其汇报使用,都是采用以原始分数作为最后成绩。学生得到的成绩汇报是他们在考试中的原始分数,即根据学生在试卷上答对的百分比直接得到的分数。高校以及各省市自治区都是使用原始分数作为录取标准。”

这也是原文中的一段话,可以这样概括,作者的观点是,高考应该仿效标准测验,应该运用标准分数。

广东省曾是我国第一个运用标准分数汇报高考成绩的省份,所以中国并不都是原始分数汇报。不过这不是主要问题,问题在于,为什么现在仍普遍采用原始分数?是因为教育部的官员不懂标准测验?其实作者应该问一问,标准测验并不是什么神秘的东西,即使我们教育部的官员都是混饭吃的,但他们有那么多专家在身边,专家会给他们提建议,他们怎么可能没听说过标准测验?或者,专家也是混饭吃的?

我想,作者可能不知道,标准分数也是有局限的,尤其是现在各省自己组织高考,并推习“3X”、“32”的考试模式。在心理测量里,标准测验之所以可以普遍采用,一个重要原因是它只有一个量表(包括等值测验),而高考涉及不同的学科,每门学科的考试可以近似地看成是一个量表,不同的量表,也就是不同的考试,结果往往有很大差异。比如,某年数学考试特别难或物理考试特别难,也就是说,如果我们把不同学科的考试看成是一个个的量表,这些量表并不等值,此其一。其二,现在高考允许学生选科目,假定甲选了历史、地理,而乙选了物理、化学,考试以后发现,今年历史和地理普遍考分较高,而物理和化学普遍考分较低,这时,理论上讲,用标准分数比较甲乙是合理的。但是,由于今年选历史和地理的人较多,而选物理和化学的人较少,这就出现一个问题,在这四门学科上,每个学科考生的总体都是不一样的。当四门学科都采用标准分时,由于它们的总体都不一样,而且总体人数差别很大,这时标准分就会严重失真。采用标准分的意义在于不同学科之间可以比较,但当总体差异很大时,四门学科的标准分是没有可比性的,这就是为什么没有采用标准分的原因(有关这个问题,有人做过专门论证,虽然我本人并不完全同意这种论证,但我知道他们有他们的道理)。

以上只是就考试和测量而论,指出作者在分析时的一些错误,正如安宁先生所说,其实这不是原文最主要的观点。但是原文中也有不少重要的表述在我看来属于理论失误,不过这些问题分析起来就更麻烦了,我就不一一指出了。


我同意你的看法,但是我还要花一点时间来回答你的帖子。我觉得在教育测量这个领域,讨论比较复杂一些。有些技术性的问题比较深奥,没有学过测量专业的人很难了解。但是此文是想分析高考政策方面的问题。重点没有抓住。我们可以帮助他把思路理清。

     谢谢安宁先生,你说得对,我们可以帮他把思路理清。
吃的是草,吐出来的也是草。

回复:(乌龙茶)安宁先生: 这篇文章确实有很多问题。...

首先很抱歉让乌先生花了很多时间来回复我的问题。大家都很忙,也许理论上的问题不合适在此探讨。我就长话短说。否则读者就都看跑了。

一是:对与教育测量理论的认识我认为国内普遍还不熟悉。但原则是既然高考是教育测量的重要实践,作为一个政府行为的高考就必须依照理论的原则去做。这是该文论述的一个基本原则。这也包括是否运用标准化考试的问题。当然运用标准化考试不能解决高考引发的问题,但是不代表标准化考试本身造成了这些问题。

二是:运用标准化考试的前提是考什么,考试的目的是什么。这两个问题不属于教育测量理论的范畴。而是教育制度与政策的问题。这部分是与文章的题目相联系:即民主与教育的关系。文章的后部主要阐述的是这方面的内容:考试内容的确定,高考目的的确定,以及高考的控制权在不同制度下的差异。这才是文章真正要表达的内容。

不知大家同意与否?

 

 

[此贴子已经被作者于2006-7-23 23:50:49编辑过]

    安宁先生:又是我先看到你的回帖,所以还是我先跟贴,呵呵。

    关于一,我认为你说的对:“标准化考试不能解决高考引发的问题,但是不代表标准化考试本身造成了这些问题”。不过我认为,标准化考试虽不是引发那些问题的祸首,但它也不是解决那些问题的关键。这里可以举一个例子,美国和英国都有针对国外考生的标准化英语测验,例如美国的托福考试,理论上讲,能够在这类考试里拿到高分(例如托福600分以上)的考生,应当已经具备基本的英语听说读写能力。但是我们中国的学生可以说是当今世界上最会考试的学生(这当然与他们接受了十几年的应试教育有关),他们就是有办法拿到很高的考分,但依然不具备基本的听和说的能力。去年我曾到一个报道,英国的一项考试因为拿中国学生没办法,不得不对中国学生附加录取条件。为什么会这样?我在前面强调过,并不是任何知识(这里取广义知识概念)都能通过考试得到检验的,而那些无法考的知识,往往是更重要的知识。

    关于二,我也同意你的判断,确实,作者的真正目的是希望高考机制的变革能体现教育民主化。但是我认为作者对这个问题的分析过于简单化了(从原文看,有些观点也不符合事实),比如他认为如果取消高考,中小学就可以真正搞素质教育了。他可能不知道,素质教育现在是有激烈争论的,不是说实践层有抵触,而是理论界有激烈争论。另外,完全取消现在这种形式的高考,目前来看是根本不可能的,这个问题说起来太复杂了,恐怕还会涉及敏感问题。我在这里简单表达一个观点:人人都知道高考有许多弊端,但大家同样清楚,这是目前条件下唯一不会引起广泛争议的考录方式。今年上海已经有高校采取面试,但主要是针对上海市区的考生,它显示上面正在放宽高校自主录取的条件。何时能够推广?何时高校能真正自主招生?在回答这个问题以前,我们必须先考量一个基本问题:如何才能保证不出现腐败?如何才能保证新的考试录取方式不至于引起更为严重的城乡不平等现象?

[此贴子已经被作者于2006-7-24 1:27:06编辑过]

吃的是草,吐出来的也是草。

乌龙茶,你好。你在北京的话有空可以来交流一下啊。我们别的别说,就说心理学框架内实验和测量(或者更准确的说,应该是“计量”)的关系。你看如何?

大树就是个广济寺旁穷扫地的.
   psyzjs兄:我在南京,你在北京,隔得太远了,不过将来有机会,一定去拜访你。
吃的是草,吐出来的也是草。