[转帖] [转贴]"国际学生评估项目"显示:上海学生成绩全球领先

 中新网12月8日电 综合报道,经济合作与发展组织(OECD)7日公布了2009年实施的第四次国际学生评估项目(PISA)调查结果,报告显示,上海中学生在数学、科学和文化水平三方面的教育水平名列世界第一。

  调查报告显示,按国家排名,韩国和芬兰在文化水平测试中仍然占据榜首,但首次参加调查的上海市在上述三个领域都处于领先位置。

  从全体来看,亚洲国家和地区有显著进步。韩国在阅读素养,新加波在数学素养,芬兰在科学素养方面位居第2。与居于首位的上海的差值在17~38分。

  这个报告每三年公布一次,数据来自经合组织对较发达地区65个国家的47万名15岁学生的考核测验。考试时间为两个小时。

  OECD成员国可以作为国家参加PISA评估,中国等非成员国则可以地区为单位参加。
师傅教导:刨花直窜过肩膀,方显木匠功夫深

老木匠的工坊
我们也参加测试的,我们区的情况很不错,但据说某上海中心城区测试结果很不好,局长、局党委书记马上召集初中校长开会,感觉和中、高考总结会一样。估计下次他们区的情况会有很大好转的,应试能力我们一向是全世界第一的。不在常态下进行的测试做不得数的。
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
这里也有报道,主要是讨论为什么美国的分数低,尤其在数学领域。特别提到了一句,高分国家,以芬兰为代表,只有最优秀的人才能成为教师。言下之意,美国的教师,不是由最聪明的人组成的。
美国数学水平差,主要是程度很大不同,差的很差,不想念的没人逼着,很快就废掉了,当然说不定其他方面强了。另外老师水平也是个因素。
请教一下祝校长和David兄:是不是上海的初中学生课程进度超过其他国家,内容更深的关系?
师傅教导:刨花直窜过肩膀,方显木匠功夫深

老木匠的工坊
2# 小妖怪
5# 老木匠

回老木匠:
我先贴些PISA的资料吧,然后再讨论您的问题。


PISA

国内关于能力测试和题库的探讨有很多,但能力测试和题库的有效结合并没有达成普遍共识。PISA的一大特色就是对15岁学生在阅读、数学、科学领域的能力测试做了深度解析,对各领域的素养内涵做了明确界定,制定了多维度的建构图作为题库建设的框架。PISA能力测试题库的建构为改进我国能力考查和题库建设提供了参考借鉴。

随着教育的普及和发展,教育质量日益受到关注,教育评价也得到了越来越多的重视和运用。我国教育评价的改革与创新将如何适应经济全球化和科技进步加快的国际环境,适应深化教育体制改革、全面实施素质教育、建设创新型国家的新形势;如何使教育评价成为促进教育发展和提高教育质量的有效途径,目前在我国还缺乏系统的理论研究和成功的科学实践。

教育评价活动中如何建构科学、有效、精准的测试题库,测试学生的综合能力,有效监测教育成效更是教育评价研究的重点。尽管我国高考命题、中考命题已经从单纯的知识考核发展到能力与知识考查并重,但如何通过纸笔测试考查学生综合素养,一直没有找到良好的途径。而学生综合素养评价有助于提高学生运用知识解决实际问题的能力,有助于培养学生的创新精神与人文精神、能使学生更关注和思考社会问题是不争的事实。

单从教育测量学角度,题库的试题全部经过包括预试在内的各个环节的检测,最大程度保证了试题的质量,增强了试题的稳定性,提高了测试信度。题库从形式上只是测量工具的载体,测量工具使用的目的和背景是题库的灵魂。题库的建设是在从难到易两个极端之间用现代教育测量理论校准试题参数,涵盖完整难易度的题目,测量不同层次受试者的水平所在。

在此以国际上颇具影响力的学生能力国际评价PISA素养测试工具为例,分析和展示了国际水准的综合能力测试题库建构,以期对我国正在方兴未艾开展的不同层次能力测试题库的开发有所启示和借鉴。

1.PISA测试工具的构成

学生能力国际评价(Programme for International Student Assessment,PISA)是经济合作与发展组织(The Organization for Economic Co-operation and Development,OECD)发起并组织实施的教育成效评价研究项目。PISA通过高品质的试卷,测试义务教育结束后15岁学生在阅读、数学和科学领域运用知识和技能解决现实问题的能力。PISA除试卷测试外还通过收集学生、学校的背景信息,从个体学习者、教学、学校及教育体制四个层面进行深层次分析。[1]PISA已发展出了常规的、可靠的,与政策相关的学生成就指标。基于PISA提供的指标,各参与国可以更好地评价和监控本国教育体制的效力与发展,从而达到关于国家教育体制的质量、公平性和效率的评价目标。

PISA在2000年首次开始在参与国家与地区正式实施评价,每3年一次,以评价正式实施当年命名。PISA2000的评价有32个国家参与,评价的重点是阅读素养;PISA2003有41个国家和地区参与,评价的重点是数学素养;PISA2006有56个国家和地区参与,评价的重点是科学素养[2]。PISA2009评价的重点又轮回到阅读素养,预计将有66个国家与地区参与。参与PISA2006的56个国家和地区的国民生产总值占到世界经济的90%,PISA教育成效国际比较代表了当今世界发达国家水平,吸引了越来越多的国家与地区参与,确立了在国际上的影响地位。

PISA能力测试题库提供了精准的测试工具测量义务教育结束阶段15岁在校生科学、数学、阅读素养。PISA测量的素养[3]是指15岁在校学生,为迎接当今不断变化的现实世界的挑战,应用知识和技能解决问题的能力,以及在日常生活情境下做出良好判断和决策的能力。它不同于且高于对于学校课程所设置的学科相关知识的理解或记忆能力。

PISA阅读素养主要是指为了达到自己的目的、为了拓展知识、发展潜能以及为了参与社会生活所需要的理解、应用和反思书面材料的个人能力。数学素养主要是指识别和理解数学在现实世界中所起作用的个人能力,做出有理有据的数学判断的个人能力,以及作为一个有独创精神、关心社会、善于思考的公民,利用数学并参与其中以满足个人生活中各种需要的能力。科学素养主要是指:应用科学知识识别问题,获得新的知识,科学地解释现象并基于证据,对与科学有关的问题得出相应的结论;理解科学作为人类知识和探究的一种形式的典型特征;意识到科学和技术如何塑造了我们的物质、精神和文化环境;作为一个有思想的公民,积极参与与科学有关的议题[4]。

PISA2006评价的重点是科学素养,评价学生科学知识的题目同时评价了学生识别科学问题、科学地解释现象、使用科学证据能力中的一种。这种设计能够通过对科学知识及关于科学的知识两种类型题目的考查为每一科学能力建构并描述其能力水平的层次等级(见图1)。

图1 PISA2006科学素养评价框架[5]

PISA阅读、数学、科学试题均以社会现实问题为设计框架,关注学生整体发展。试题情境的选择范围包括学生的生活、社会生活和自然世界,突出体现个人、社会、自然的内在整合,体现科学、艺术、道德的内在整合。试题以学生的现实生活为背景,以社会实践为基础,强调基于学生的直接经验,密切联系学生的自身生活和社会生活,充分挖掘信息资源。综合运用学生所有的知识对学生自主选择的问题进行跨学科探究,以获取学生自己的结论。有助于学生了解社会,关心社会,形成健全的人格。立足于人的个性的整体性,立足于每一个学生的健全发展。

PISA2006经过在56个参与国家与地区大规模实地试测,排除不同文化背景和语言翻译的影响,精心选用了题库中测量属性良好的28道阅读题目,48道数学题目和103道科学题目完成了15岁学生阅读、数学、科学素养测试并进行了测试结果的国际比较与趋势分析。没有题库提供科学的、规范的和稳定的试题,国际比较与趋势分析根本无从谈起。

云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
2.PISA科学素养的评价
PISA研究的目的是形成一套指示,用来说明为把15岁的学生培养成为积极的、善于思考的、有智慧的公民,从他们运用科学、数学、阅读的角度看,各个国家的教育成效如何。为了达到这个目的,PISA创立了科学、数学、阅读评价框架,评价的焦点是确定学生运用所学知识的能力水平。
PISA项目自1997年以来就在世界范围汇集专家,其评价框架的建立是一个不断努力的过程:首先明确评价领域的测量目的和描述测量目的背后的种种假设;利用建立在现有文献基础上及大规模测试经验基础上的测量目的定义,为测试设计中将使用的关键测量目的特征制定操作性说明;为各评价领域制定建构图[6]并通过现代教育测量理论检验其效度和信度。建构图提供了一种通用语言,同时也提供了一种讨论评价目的和评价会测量出什么内容的载体。这种讨论会激励形成围绕着建构图和测量目的的统一意见;分析和测试与成绩相联系的知识和技能,为确立能力水平层次打下基础。
PISA描述的15岁在校生科学素养从高到低分6个能力水平,也即PISA科学素养的建构。处于最高水平6的学生能够识别科学问题、解释科学现象,能够在各种复杂的生活情境中应用科学知识和关于科学的知识。他们能够将各种不同的信息来源与解释联系起来,并使用这些信息源的证据证明自己决策的正确性。而处于最低水平1的学生科学知识有限,仅能够将这些科学知识应用于少量的熟悉情境。他们能够提供较为明显,能够直接从给定证据中推理出的科学解释[7]。
能力水平是潜在的而不是外显的,并且这个潜在的能力水平是连续的。概括地说,一个建构图可以被看成是一个一维的潜在变量。事实上,许多的测量可能是多维度的。如PISA科学素养又分为“识别科学问题”、“科学地解释现象”和“使用科学证据”3个能力维度[7]。PISA的做法为每一个维度制定一个建构图。
建构图的制定是题库建设的第一步。我们必须清楚界定我们所欲测量的变量。在此变量上发展良好的学生,会有怎样的外显行为?发展普通的学生会有怎样的行为?发展欠佳的学生,又会怎样?理清了这个变量的意义和行为之后,就要规划题目。哪些题目可以反映出发展良好的学生的水平,哪些题目可以反映出发展普通或欠佳的学生的水平?然后将行为与题目放在一起,如图2使用科学证据建构图所示。图2中的直线就是代表使用科学证据这个变量,越上方表示发展越好,越熟练。左边是每个水平上学生应该达到的精熟程度,右边是相对应的学生应该能够完成的特定任务,这就是所谓的建构图。有了建构图,题库建设者必须考虑使用一些方法,使得理论上的测量目的可以在现实世界的情境中显现出来,题目就是测量目的的实现形式。
PISA科学素养测试为“识别科学问题”、“科学地解释现象”和“使用科学证据”三个能力维度分别制定了建构图。在此,限于篇幅仅列出使用科学证据建构图(见图2)。
建构图制定的主要动机就是让它充当评价的框架和制订度量的可能方法。PISA侧重于测量广义的“素养”,评价内容取自于更广泛的领域,即不局限于在校学习的基于课程的已经掌握的单一知识,而是强调知识在不同情境中的应用和形成面对实际生活挑战的能力。
每个水平上学生应该达到的精熟程度
处于水平6的学生能够通过检查支持性的证据,比较并区分几个竞争性的解释。他们能够综合多个来源的证据形成自己的观点。
处于水平5的学生能够解释以各种形式呈现的来自相关数据集的数据。他们能够识别并且解释数据集中的相异与相似之处。并且基于这些数据集中所呈现的联合的证据做出结论。
处于水平4的学生能够通过总结数据,解释相关模式来理解通过多个形式表达的数据,例如表格的,图表的和图样的。他们能够使用数据得出相关结论。学生还能够确定数据是否支持关于某个现象的论断。

处于水平3的学生在回答问题,证明或否定某个给定的结论时,能够从数据中选择一个相关的信息。他们能够从数据集不复杂的、简单的模式中做出结论。在简单的情况中,如果信息充分的话,他们还能够支持某个结论。
处于水平2的学生,在给出合适线索的情况下,能够识别出图标的一般特征;在给出陈述的情况下,能够指出图标或简单表格的某个明显特征。在对日常用品的功能进行选择时,他们能够识别出这些物品的功能。
处于水平1的学生从与日常生活背景相联系的事实表或图标中抽取相关的信息。当需要对柱状图中柱子的高度进行简单比较时,他们能够从中抽取信息。在常见的、经验性的情境中,处于这个水平的学生能够进行归因。         高熟练
程度



低熟练
程度         学生应该能够完成的特定任务
能够认识到相同的一组证据可以形成备择假设。能够根据证据检验竞争性的假设。能够使用多个来源的数据建立关于某个假设逻辑论证。
能够比较并讨论在同一组坐标轴上所画出的不同数据集的特征。能够识别并讨论测量不同变量的数据集之间的关系。基于对数据充分性的分析能够做出结论有效性的判断。

能够根据具体的问题,定位于图表的相关部分,进行比较。在分析某个研究的结果或做出结论时,知道如何进行控制。能够解释包含两个测量指标的表格,并且做出这些变量之间关系的可信论断。通过参考图例表征和一般的科学概念,能够识别某个简单易懂的技术设施的特征并形成操作方法的结论。
对于给定的具体问题能够从文本中找到相关的统计信息。对于给定的具体证据或数据,能够在恰当与不恰当的结论中做出正确的选择。能够在给定的情境中,应用一组简单的标准做出结论或进行预测。给定一组功能时,能够确定他们某个机器是否具备这些功能。
能够比较简单表格中两列测量指标,并说出差异。能够说出一组测量指标或简单的线条图、柱状图的趋势。对于常见的日常用品,能够从一列属性中选出这些物品的属性或特征。

在与柱状图相关的特定问题进行作答时,能够比较柱状的高度,并对所观察到的差异进行解释:给定自然现象的某个变化,在某些情况下,能够找出合理的原因。例如,风的涡轮的变化可能是由于风力的变化所导致。
图2 PISA2006使用科学证据建构图[8]
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
3.PISA科学素养试题举例
PISA测试强调在现实生活中的能力考查。PISA测试不在集中于学校里传授的知识和技能的考查,而是重在测量学生在实际生活中创造性地运用学校教授的知识和技能的能力。PISA测试更加关注学生的能力的提高,关注学生的可持续发展,评价学生能否积极参与社会活动,关注那些有利于成为终身学习者的知识和技能以及与未来生活有关的基本知识和技能的考查。
PISA测试题目多项选择题,复合多选题,开放性回答题目各占l/3。测试题目通过单元的形式成组地编排为题组,每个单元创设了一个真实的生活情景。
PISA所有开放性回答题目,都由培训合格的编码评分员根据评分标准给出相应编码的方式来评分。其中,编码所代表的分数有三种:满分、部分得分、零分;编码有双位编码和一位编码两种。编码的评分方式有利于把握学生解题思维的性质和学生对于更高层次的思维方法的掌握情况。其双位编码首位给出了学生应得的分数,末位则按照学生在解决给定问题的过程中所使用的策略、或是按照阻碍学生得出正确解决方案的错误概念给出特定代码,这种评分方式有利于后期数据分析的进行以及最终评价结果报告的生成。
PISA开放性回答的命题和编码评分,题目设计精巧,评分标准宽泛,不是简单地检查知识的记忆,而是考查学生在题目背景信息下,运用自己的知识和技能可不可以最方便地解决实际的问题。PISA的试题和编码评分设计体现让利于学生原则,重视学生的思维品质,不同的思维过程,值得我们在能力测试中借鉴和应用。
以下以PISA2006科学素养测试真题温室效应[9]为例,展示PISA单元题目形式,单元中各个问题与建构图的对应关系、双位编码的考查方式。评分标准每个编码后均有大量学生反应样例,在此,限于篇幅略过。
温室效应题干:
阅读下文并回答问题。
温室效应:事实还是幻想?
生物需要能量才能生存,而维持地球生命的能量来自太阳。太阳非常炽热,将能量辐射到太空中,但只有一小部分的能量会到达地球。
地球表面的大气层,就像包裹着我们的星球表面的毯子一样,保护着地球,使它不会像真空的世界那样,有极端的温差变化。
大部分来自太阳的辐射能量,会穿过大气层进人地球。地球吸收了部分能量,其他则由地球表面反射回去。部分反射回去的能量,会被大气层吸收。
由于这个效应,地球表面的平均温度比没有大气层吸收能量时的温度高。大气层的作用就像温室一样,因此有了“温室效应”一词。
温室效应在20世纪越来越显著。
事实表明,地球大气层的平均温度不断上升。报刊杂志上常说,二氧化碳排放量增加,是20世纪气温上升的主要原因。
小德有兴趣研究地球大气层的平均温度和地球上二氧化碳排放量之间的关系。
他在图书馆找到下面两幅曲线图。
  

小德从曲线图中得出结论,认为地球大气层平均温度的上升,显然是由二氧化碳排放增加而引起的。
问题1:温室效应
曲线图中有什么数据支持小德的结论?
评分标准
满分
编码为11:指出(平均)温度与二氧化碳排放量均上升。
编码为12:指出一般而言,气温与二氧化碳的排放量有正相关。
零分
编码为01:指出(平均)温度或二氧化碳排放量其中一项有上升。
编码为02:指出气温与二氧化碳之间有关系,但没有清楚表明两者有什么关系。
编码为99:没有作答。
问题2:温室效应
小德的同学小妮却不同意他的结论。她比较两幅曲线图,指出其中有些资料并不符合小德的结论。
请从曲线图中举出一项不符合小德结论之处,并说明理由。
评分标准
满分
编码为2:能够指出两幅图中,有哪一部分的曲线不是同时上升或下降,并作解释。
部分得分
编码为1:指出了正确的时期,但没有给予解释。

举出了证据,证明小德的结论不是正确的,但却写错了时期。
零分
编码为0:仅仅就其中一条曲线的改变趋势作出描述,而没有把改变与两幅图联系在一起。
编码为9:没有作答。
问题3:温室效应
小德坚持自己的结论,即地球平均温度的升高,是由于二氧化碳排放的增加而引起的,但小妮则认为他的结论太草率。她说:“在接受这个结论之前,你必须确定在大气层内其他会影响温室效应的因素维持不变。”
请写出小妮所指的其中一个因素。
评分标准
满分
编码为11:能够写出一个因素,该因素与太阳发出的能量或辐射有关。
编码为12:写出一个自然成分,或污染物。
零分
编码为01:写出影响二氧化碳浓度的因素。
编码为02:不够明确或不够具体的因素。
编码为03:其他错误因素或其他答案。
编码为99:没有作答。
命题立意
本题以当前世界上日益严重的环境问题——温室效应为入手点,考查了观察图像并从图中获取信息,以及对图形、数据进行分析并得到相关结论的能力。具体情况如下表所示:
题目         题目形式         能力及其层次         科学知识         关于科学的知识
问题l
问题2
问题3         开放性回答
开放性回答
开放性回答         使用科学证据(水平3)
使用科学证据(水平5)
科学解释现象(水平6)          

地球和空间系统         科学解释
科学解释
试题特点
(l)试题突出考查了学生从图中获取信息的自学能力。
题中所有的证据都是以图像的形式给出的,学生需要在读懂图像的基础上,发挥自己进行比较、归纳,分析得出自己的结论,因此本题较好地考查了学生的思维能力。
(2)试题鼓励学生的创造性思维。
本题的问题1和问题3都是双位编码,其特点是学生作答的情况虽然均可得满分或零分,但可清晰地反映出其思维过程的差异性,对科学证据理解的差异性。这种编码方式区分度较高,可使优秀学生脱颖而出或深入挖掘未答对题目的学生的问题所在,在一定程度上鼓励了学生的创造性思维。
PISA题库采用建构图这一形象的标淮将学生和题目归入各个能力水平同一把量尺。以图2使用科学证据建构图简单比喻,建构图直线左边是学生,右边是题目,题目就是这把量尺的刻度,题目要在量尺上均匀分布。PISA2000打磨的是阅读素养“提取信息”、“解释说明”、“反思并评估”[l0]量尺;PISA2003打磨的是数学素养的“变化和关系”、“数量”、“空间和形状”、“不确定性”[11]量尺;PISA2006打磨的是科学素养的“识别科学问题”、“科学地解释现象”、“使用科学证据”量尺。而拥有精确刻度,覆盖所有量尺的就是PISA5000多道由各参与国家与地区贡献,并经过现代教育测量理论检定的题库。
建构图显示出PISA如同测量学生身高一样,用通过现代教育测量理论建构的试题题库打造了测量学生素养的精准量尺。PISA打造的是一把钢性的量尺,试题难度不会像传统测试的弹性量尺随受试人群样本的能力不同而变化。各参与国一致认同PISA客观等距量尺测量出的学生素养,其高品质保障的取样、测试管理机制和最新的数据后期分析使PISA跨国和跨年度的比较具有高度的有效性和可信性,同时又如同比较学生身高一样简单明了。
能力测试题库建设是一项巨大的系统工程,要集中大量的学科专家和教育测量专家进行能力测试测量目的的制定,建构图的描述,试题和评分标准的编制、审定、预试和调整等。PISA的经验来看,加强测量专家、学科专家和命题人员的结合,发挥各自所长,是加速能力测试题库建设的关键因素。
参考文献:
[1][3]OECD. Learning for Tomorrow's World: First Results from PISA2003[M]. Paris: OECD,2004.23-25.
[2][4][5] OECD. Assessing Scientific, Reading and Mathematical Literacy: A Framework for PISA 2006[M].Paris: OECD. 2006.8-44.
[6]Wilson, M. Constructing measures:An item response modeling approach [M]. Hillsdale, NJ: Lawrence Erlbaum Associates, 2005.3.
[7][8][9] First Results from PISA2006 [M]. Paris: OECD,2007.30-75.
[10]OECD. Measuring Student Knowledge and Skills: The 2000 PISA Assessment of Reading, Mathematical and Scientific Literacy [M]. Pans:OECD. 2000.17.
[11] OECD. The PISA2003 Assessment Framework: Mathematics, Reading, Science and Problem Solving knowledge and Skills [M].Paris:OECD,2003.8.
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
本帖最后由 小妖怪 于 2010-12-9 13:06 编辑

在阅卷过程中的十六位阅卷专家曾经回答过以下问题:
一、在PISA出的试题中,哪些知识和技能是上海学生接触比较多的,而哪些知识和技能是上海学生接触很少,或没有接触过的?
答案如下:

R1: 1)文学性文本的理解和分析——多。2)解决生活中实际问题——未接触3)文学文本的形式特点——少接触。
R2:在内容,主题的阅读理解中,上海学生接触比较多,在平时学习、考试中,学得多,考得多。在形式的评价、图表的识别,标题的应用方向,上海学生接触的较少。
R3:实用类、生活类的较少。
R4:感受类和学生接触较多,生活实用类的、图表类的学生难把握。
R5:对于事件的认识和看法接触较多,但读图能力,生活实用信息接触较少。
R6:对文本内容理解的题,如《木偶娃娃》之类。知识检索类的题,如《衬衫》《南极》《办公易》《巧克力》等等。
R7:检索信息,诠释文本——接触较多。反思,评价——接触较少。
R8:基础性的、直观的、诠释文本信息类的较多。而反思,评价类、运用生活知识技能回答文本提问方面的较少。
R9:理解性知识,主观评价类题目上海学生比较熟悉。从生活实际的样例中检索信息作出判断之类的题目,则相对较少些。
R10:实际运用的知识与技能学生接触少些。文学类的知识与技能学生接触少(是否应该为“多”?)些。
R11:这次PISA试题中文学性语段是我们学生接触较多的,而图表转化为文字表达的能力是我们学生欠缺的。
R12:文学性文本(不包括戏剧)和具有实用性及连续性文本,无论信息提取还是文本内容反思、评价、作出解释都比较适合上海学生的能力,而一些非连续性文本由于日常教学中较少呈现学生答题情况也就不太好。
R13:对文艺类文体中的主观感受,学生接触较多,生活常识类的应用性考察学生接触的较少。
R14:接触较多:信息筛选、检索。接触较少:反思与评价类。
R15:检索信息、反思文章形式这种知识和技能学生接触很少;而反思和评价内容,综合与诠释类学生接触比较多。
R16:考查文章主旨、中心、内容概括的题型上海学生接触较多且掌握较好。但搜索信息并实际运用类的题目,我们学生接触较少且成绩不太理想。
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
二、根据PISA的评分培训和评分工作,您觉得,PISA的评分方法和要求与上海的中考评卷或学校其他大型考试,有什么不同或相同?(例如:数学和科学评卷中用两位数代码区分学生不同的思路和方法,阅读评卷中,一些开放题学生回答是与否都能得分,关键是要写出证据并自圆其说。)您觉得这种评卷有什么参考价值?
R1:对考生实际能力的测评分析更细致一点,但在中考评价中有操作上的难度。
R2:目前我国在阅读方面的考试答案多是唯一的,而且多是重在阐述结论而不是解释原因。这实际上与我们目前倡导的三维目标也是相悖的(过程与方法)。  我觉得PISA的评分标准有利于培养学生的创造性思维,是很有必要的。
R3:更开放、更趋于合理,对于我们的制订评分答案有参考价值。
R4:学生只要试图答题也能得到肯定,比较人性。
R5:不同:涉及范围广,生活指导性更强。相同;都关注了学生的理解,和认知能力。
R6:1)评分方法和要求更趋于合理,如要求阅卷老师保持适当的阅卷速度,勿贪多求快;每次只批一道题,勿受其他题目的影响,这都是用一种比较客观、公正、清晰的思路进行评分,这与中考评分的抓时间赶速度有很大的不同。PISA尽可能发现学生的闪光点,与我们考试中尽可能发现学生的有何错误,有何不懂的地方也明显不同。2)没有很大的参考价值。
R7:PISA 评分更具人性化,充分发现学生理解上的长处或者说是可成立的理由,如阅读评卷中R111Q02B题考测“反思文章形式”、但学生谈论文章内容也可适当给分,这与上海大型考试的评分有很大的差别。现实状态下,以为不具参考价值。
R8:阅读的这种开放程度是与国内考试完全不同的,这种评卷对于鼓励和引导学生发挥创造性思维,培养其求异思维和批判性,从而培养的学生不再是千篇一律的,而是个性鲜明的个体。
R9:答题中不讲究语法、错字等做法,及直接选用生活中细小样例作为考题。这些的差异较大。这种样题可以提醒我们中考或其他考试要更接近生活一些。
R10:应该是更学生更宽容的学生环境,有利于思维的发展而不是僵化。
R11:我认这种评分方式对学生思维方式更加包容,也认同了人的不同思维方式。
R12:PISA对答案和评分标准的研制比我们通常的考试要细致得多,好处是可以此保障对学生评价的公正性。
R13:运用多种代码,有完全得分和部分得分,挖掘学生答题的合理性因素,并能给出答案的详细分类和解释,值得我吸取。
R14:发散性思维的题目较多。可以培养学生创新能力。
R15:不同的是1)PISA给的样例:类型多样。2)充分考虑了评分者的劳动强度。并强调在单评时可以充分发地交流,以保证评定的准确性和评判标准的一致性。3)开放性的题型占的比重较大,可以国内的评价者更充分地交流空间、时间。4)评分者依次给每题评定,保持评卷时标准的一致性。
R16:有一定参考价值,考查学生思维品质的题目可参考这一题型。
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
本帖最后由 小妖怪 于 2010-12-9 13:13 编辑

  • PISA评分的基本原则是要求评卷专家从整体上判断学生是否理解题目,以及能否用正确的思路和逻辑回答问题,评分中可以忽略学生的错别字和语法错误。

  • PISA考试至少给了我们一个全新的理念“学以致用”,这应该是我们今后教学和检测的一个方向。他告诉我们在今后的考试及评价中,应充分考虑这一因素,避免出现学生高分低能的现象。
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
上海的学生成绩比较领先的原因我认为有四点:
一、与全国其他地区相比上海还是非常注重“素质教育”,又有地域的优势,升学的压力相对较小,与外省市的学校相比,学校关注的焦点也不完全在学生学业成绩上,“死读书"的情况相对好很多,学生受应试教育的毒害轻些,家长的整体素质也较高,更加多些地关注孩子综合能力的培养,在这样一个立体氛围的影响下,孩子们就被摧残得相对少些,思维也相对活络些,PISA测试成绩相对于中国其他地区就好一些。
二、与国外相比,中国的基础教育还是比较扎实的,教学的规范,教材难度相对较高,都是我们的孩子容易取得好成绩的原因。
三、就上海而言,据我所知参与PISA考试的学校的学生也是经过挑选的,至少是中上以上水平的学校的学生,我个人以为不能完全代表上海15岁学生的平均水平,这样的样本也为取得较好的成绩奠定了基础。
四、我们国家似乎有个习惯,但凡涉及到 "国际"二字就会高度重视,咱们要面子从奥运会到世博会都能感受到,PISA测试也是国际考试,自然也很重视,也许别的国家只是把这样的考试当做常态下的考试而已?
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
三、就上海而言,据我所知参与PISA考试的学校的学生也是经过挑选的,至少是中上以上水平的学校的学生,我个人以为不能完全代表上海15岁学生的平均水平,这样的样本也为取得较好的成绩奠定了基础。
============================

谢谢祝校长!

有点田忌赛马的意思,本身问题是针对义务阶段全体学生的任意组合班级样本吧
师傅教导:刨花直窜过肩膀,方显木匠功夫深

老木匠的工坊
明报12月8日这样报道:    美国总统奥巴马周一在北卡罗来纳州发表演讲时,列举中国在科研教育等领域领先美国之处,并以1957年前苏联发射人类首枚人造卫星Sputnik作比,称美国人正迎来另一次「卫星时刻」,必须加强对科研创新和教育的投资。《纽约时报》昨亦不约而同地称,上海在学生能力国际评估计划(PISA)中名列前茅,亦令美国学者对中国教育水平惊叹,在列根政府出任教育部官员的芬恩(Chester E.Finn Jr.)亦说﹕「我很震惊,我想起Sputnik。」     奥巴马说,能在未来全球竞争中赢出的国家,将是那些大多数工人受过教育、认真进行科研、拥有高质量基础设施的国家。「几年前跨国公司被问及计划在哪里建立新的研发基地时,80%公司不是选中国就是印度,因为这些国家重视数学和科学,也重视对工人的培训和教育」。奥巴马说,这让他很「受伤」。「残酷的现实是:在未来的竞争中美国有落后的危险」。

    奥巴马列举了中国在科研等领域取得的成就:中国高铁规模已超过美国过去30年所建的高铁,中国拥有世上最快的火车及世上最快的超级电脑,最近又开设了世上最大私人太阳能研发基地。「我们这一代人的『卫星时刻』又回来了。」奥巴马称正是当年的「卫星时刻」敲响警钟,促使美国对教育和科研的投资,最终美国不仅超越了前苏联,还开发了新的技术、产业和就业,如今美国也有此需要。

    测试全球65个地区逾40万名15岁学生水平的PISA昨公布成绩,代表中国首次参加评估的上海学生,在阅读、数学和科学项目都居首获誉全球最聪明学生。相比下,美德法英等西方强国的学生,仅得平均成绩。曾造访中国很多学校的前教育部官员芬恩坦言﹕「我见识过中国在追求目标上如何努力不懈。若上海能在2009年(达此水平),2019年就会有10个城市(达到),到了2029年就会有50个城市。」经济合作及发展组织秘书长亦说﹕「更佳的教育成绩,是未来经济增长的有力预测指标。」
今天,我就是高瑜
参加过江浙沪的自主招生考试面试,相比江浙学生,上海学生普遍比较见世面,不怯场,能说会道的多

就我设计的那个开放性题目来看,上海学生的平均表现略佳,而最好的表现却是江浙的
师傅教导:刨花直窜过肩膀,方显木匠功夫深

老木匠的工坊
观点:上海学生考高分 美国应警醒
CHESTER E. FINN JR.

当年“旅行者号”(Sputnik)人造卫星的发射在美国教育界引起了一场地震,因为它让我们有理由相信苏联已经跑在前面。53年过后,中国又给我们带来新的震动。去年来自65个国家的15岁学生参加一轮数学、阅读和科学考试,结果上海少年在三个科目中均超过其他任何地区。香港这三个科目也都排在前四。

这是经济合作与发展组织(OECD)组织的“学生能力国际评估计划”(Programme for International Student Assessment,简称PISA)考试,香港已经参加前几轮,但2009年这轮还是中国内地少年第一次参加。参加的只是上海这座中国首屈一指的城市,中央政府给了它大量投资与关注、诸多优惠政策,以及在中国来说相对较高的自由度。但美国人如果想当然地以为上海学生的成绩属于某种形式的反常,那就是大错特错了。

如果说2009年中国可以有一座城市出现PISA最高分获得者──上海2,000万的人口比很多国家的人口总数还多──那么在2019年就可以有10座城市、2029年可以有50座城市出现最高分获得者。或许还会更快。

我对PISA有所保留,对它怎样界定知识、测试什么、怎样摆脱学校课程不敢苟同。但其国际排名获得了普遍信任,人们认为这个排名能够可靠地反映不同国家年轻人在核心学术科目中的高下。

上海是怎样拿到第一名的?经合组织方面的人士把上海称为“改革先锋”,给出了一定的解释。具体来说就是它接近普及的教育体系,激烈的竞争(按学生进入大学、最佳中学的人数衡量),非常高的学生参与度,现代化的评估体系,充满雄心的课程设置,以及一个干预薄弱学校的计划。

今天中国多数城镇都没有这些资源。但明天的情形很可能大为不同。

在PISA考试中接近第一的另外五个国家和地区应该不会让人意外,它们分别是新加坡、台北、芬兰、韩国和日本。在阅读方面,加拿大、新西兰、澳大利亚和荷兰也表现不错。美国在阅读和科学科目中又一次排在中间,数学略低于国际平均水平。所以我们并没有越来越差。但我们多数时候是与过去相当,而非常微小的进步又被其他很多国家甩在了后面。

很多专家长期以来都在指出这个趋势。但在本周以前,我们至少可以假装认为中国不属于那些构成威胁的国家之列。我们可以将香港视为特例,它有英国遗留的影响,并享有经济的繁荣。我们可以让自己相信中国的兴趣只是建设大坝、购买我们国债、制造假冒普拉达(Prada)手包、跟其他所有人打价格战,并给我们孩子的玩具涂上有毒涂料,同时忽略了它的教育体系。

是的,我们知道他们在输出中文教师在我们的学校教授普通话,同时引进母语为英语的人士去教他们的孩子学我们的语言。但我们可以安慰自己说,他们的课程设置强调的是纪律约束和死记硬背,而不是分析与创造。

今天这种安慰已经被一扫而光。我们必须直面事实,中国已经下定决心要在教育方面超过我们和其他所有人。

这条消息会不会敲响警钟,让我们知道美国需要认真对待教育成绩?它是否会让我们不再找借口,不再相互推诿,不再只重视大人而忽略孩子?

但愿如此。

(作者为斯坦福大学胡佛研究所(Hoover Institution)高级研究员,福特汉姆研究所(Thomas B. Fordham Institute)所长,曾任美国教育部助理部长。)
观点:上海学生考高分是中国教育的失败

江学勤

具有讽刺意味的是,正当全世界欣赏中国教育体系的优点时,中国却意识到了自己的缺陷。如同一枚硬币有正反两面一样:中国的学校十分善于帮助学生应付标准化的考试。正是由于这个原因,他们无法帮助学生们做好接受高等教育和知识经济的准备。

学生"低能"不怪中国教育
去年来自65个国家的15岁学生参加一轮数学、阅读和科学考试,结果上海少年在三个科目中均超过其他任何地区。但是为什么中国的技术创新总体上还是跟不上呢?这确实是中国文化的“软肋”。周二,几名来自上海的15岁学生在经济合作与发展组织(OECD)组织的“学生能力国际评估计划”(Programme for International Student Assessment,简称PISA)考试中获得了阅读、科学和数学项目的世界冠军。对任何在中国学校工作的人来说,他们都不感到意外。

有了望子成龙的父母,雄心勃勃的学生和一种痴迷于考试的文化,中国的九年制义务教育也许是世界上最为严格的。而上海,一个开放性的国际化都市,有着无限的雄心和残酷的竞争,它一直以来都是中国九年制义务教育的先锋。

所以说,中国在产生中等水平的会计、电脑程序员和技术专家方面是没有问题的。可那些引领21世纪全球经济所需要的企业家和创新者呢?中国最有前途的学生还是必须到海外去培养他们的管理能力和创造力,在那里他们必须抛弃被灌输给他们的那套以考试为中心的学习方法。

死记硬背式体系的缺点已是众所周知:社会及实践技能不足,缺乏自律和想象力,丧失好奇心和学习热情。中国学生拼尽全力考上大学,而在那里许多人却玩着《魔兽世界》来消磨时间。

跨国公司和中国企业对中国的大学毕业生有着同样的抱怨:他们无法独立工作,缺少团队工作所需的社会技能,傲慢自负不屑于学习新技术。咨询公司麦肯锡(McKinsey) 2005年发布的一份报告说,中国现行的教育体制将阻碍其经济发展。

可难道PISA考试的结果不是至少说明了中国的九年制义务教育是世界上最成功的、说明了标准化考试,就像美国总统奥巴马(Barack Obama)似乎认为的那样,对于发展美国的学校是必要的?

不一定如此。根据对教育进行的研究,利用考试来构建教育体系是一个错误。学生们会失去与生俱来的求知欲和想象力,在追求高分的过程中变得失去安全感,无从辨别是非。

就连上海的教育学者也承认,他们仅仅是在制造具有某种能力的平庸之辈。经合组织的报告指出,考试的要求几乎使学生没有自学时间,也没有自学的机会。报告还谈到,上海一位经验丰富的教育学者说,就时间和空间而言存在一种机会成本,学生在一种狭小发展空间的环境中成长,对于将来的工作和生活还没有做好充分准备。这被视为一场严重的危机,而这场危机又由于独生子女家庭的现实被放大。

在越来越多的人看来,中国的学校非但没能帮助中国超越西方,反而阻止了它的发展。它们让每个人都具备了基本知识能够在一个社会主义经济体中发挥作用。可既然中国实行的是市场化经济,希望在全球展开竞争,因而对于美国有能力让它最聪明的学生成长为世界上最优秀的科学家和商人,中国是羡慕这种能力的。

改革即将出现。中国政府今年公布了一项十年规划,内容包括加大实验力度。中国中央电视台(CCTV)近日在晚间一档主要的新闻节目中报道了北大附中为增强学生个性和多样性而进行的课程改革。

北大附中国际部是经政府批准建立的一个实验性项目,旨在帮助学生为适应美国的学习做好准备,作为该项目负责人,我参加了北京高层教育官员支持引入西方课程的会议。不过可以说,中国短期内还不会对美国在教育领域的领导地位形成挑战,这种说法是没错的。

上海学生在PISA考试中取得的优异成绩是这种问题的“症状”。考试与实际生活和工作技能的关联度不如一个人的写作能力。要写出一篇条理清晰的文章,首先要能找出问题所在,将它分解成各个部分,再从多角度对它进行分析,最后以言简意赅的方式总结出解决方法,语言简练地把观点表达出来,并能在不同文化之间交流,历久弥新。如果中国学生要在全球范围拥有竞争力,这种批判式思维的技能是他们需要学习的。

所以,教育改革的第一步是试着教会那些考试高手写出好文章。要写出优秀的英语文章,学生们需要理解一些概念,比如论点和论据,结构和支撑,连贯性和流畅性,语气和受众,措词和句法──这些概念在中国的学校几乎不曾被用到。有一件事情将来可以让我们知道我们在改变中国教育体制时取得了成功,这就是中国学生的PISA得分降低了。

(本文作者江学勤是北京大学附属中学校长助理兼国际部主任。)
我想用马拉松跑来看上海领先的现象。谁赢还是要看后劲,后半程(到大学后)是否保持后劲,在这方面我的判断是美国前松后紧的做法长远效果会好。
另外这样的国际比较样本采集都是有问题的,除非分层随机采样,否则可比性会是问题(即样本的代表性,how representative is the sample of the population in question)
我有今年PISA考试的全套题目,但就是不会转换成WORD文档上传上来。
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream
全球教育关注度因PISA升温
观点一:上海的成绩令世界震惊,同时也挑战了世界对“中国学生只会死记硬背”的传统认识,引发了有关参与国家对本国教育的反思。

《环球时报》报道称:西方媒体则普遍感到震惊,称全世界对中国的经济崛起有目共睹,但对其教育改革的成绩毫不知情,这一次表明了中国已经下定决心要在教育方面超过所有人。《华盛顿邮报》援引里根政府教育部官员切斯特.费恩的话,他对上海学生的PISA考试成绩感到震惊,“其带来的心理震撼不亚于‘珍珠港事件’和前苏联抢先将人造卫星送入太空”。美国《时代周刊》等多家媒体引用了OECD秘书长安赫尔·古里亚在PISA 2009国际报告前言中的话:“中国上海学生的表现令人震惊,他们在这次评估的每个领域中都以明显优势领先,这表明了在多元社会背景中,凭借中等经济资源也可以取得令人瞩目的教育成就。”《法新社》报道称,“根据一项国际重要调查,上海青少年有全世界最好的教育。”

在赞叹和惊讶的同时,美国时代周刊等多家媒体引用了OECD秘书长安赫尔·古里亚在PISA 2009国际报告前言中的话,他说在数学领域,上海有四分之一以上的15岁学生能够根据自己的研究和对复杂问题的建模来构思、概括和创造性地使用信息,他们在解决新问题时,能应用自己的理解和见识,以及新的方法和策略,而OECD只能3%的学生达到这一水平。”英国《金融时报》:“关于东亚的学校教育存在两种成见:一是学生们极其刻苦,二是学习靠死记硬背。但‘实际情况没有那么简单’。”“上海的学校不是在培养死读书的学生,而是引导学生将能力和热情转化为优异成绩。”美国《时代周刊》:上海PISA的成绩应该归功于“大规模地提高了教师的待遇和培训投入,减少了死记硬背的教学内容,注重在课堂上开展各种解决问题的教学活动。”

鉴于上海的优异结果,部分外媒甚至认为,与中国上海相比,他们的教育落后了,要努力追赶。《华盛顿邮报》援引美国现任教育部长邓肯话:“这是让我们醒来的号角,我们可以诡辩,也可以认可美国教育落后的残酷现实。《新民晚报》“教育新观察”作者最近去日本东京,“惊讶的是,女导游竟然多次提及最近揭晓的PISA成绩,她羡慕中国上海的孩子得到了世界第一的好成绩。”

观点二:优异的测试结果从何而来,来自精英教育、应试教育传统吗?

一些媒体认为上海优异的测试结果主要来自精英教育。《参考消息》发表了对哈佛大学花海燕教授的采访稿,花教授对上海的成绩一点也不感到意外,她认为中国的整个系统是拔尖教育。韩国《朝鲜日报》韩国教育课程评价院院长认为“上海之所以取得好成绩,主要是因为精英教育”,包括学校间激烈地竞争、学校内的“英才班”以及教师队伍素质的显著提高。

对于上述观点,也有媒体发表完全不同的看法。12月7日美国《时代》周刊指出:中国上海的青少年在测试的所有三门学科上,得分都遥遥领先其他国家的同龄人。我们可以从中借鉴的是,上海和香港摒弃了针对少数精英的重点教育模式,采取了一种兼容的教育体制,两地大规模地提高了教师的待遇和培训投入,减少了死记硬背的教学内容,注重在课堂上开展各种解决问题的教学活动。

    还有媒体报道,测试结果均位居第一,是因为学生应试能力强。《纽约时报》报道上海PISA测试结果后,有人在其网站上评论到:中国的教育制度把学生教育得善于考试。学生们在考试中的表现好得难以想象,但是其他地方就并非如此了。例如,TOEFL成绩接近完美的中国学生,当他们到了美国大学后,对英语的掌握却非常差。

观点三:中国学生测试成绩好,但是他们的负担很重,现行教育体系对学生创造力培养依然不足

媒体认为,好的结果依然不能掩盖现行教育体系培养创造力的问题,学生创造力不高的事实依然客观存在。《华尔街日报》:“中国在产生中等水平的会计、电脑程序员和技术专家方面没有问题,但是在产生那些引领21世纪全球经济所需要的企业家和创新者方面需要打上一个大大的问号。中国最有前途的学生还是选择到海外去培养他们的管理能力和创造力,在那里他们必须抛弃被灌输给他们的那套以考试为中心的学习方法。《悉尼先驱晨报》引用澳大利亚课程及评核机构负责人希尔的观点:“中国学生缺乏创造力,以及总被雇主抱怨,更多是因为儒家文化,它强调学生对教师乃至文化的遵从,而非个人能力。这也能解释为什么中国乃至东北亚国家的学生考试成绩都很好,但实际却并不开心,因为他们实在太努力了。”

还有媒体认为,上海学生的好成绩是通过增加课业负担所得的,并且牺牲了其他内容的学习。《纽约时报》指出:(上海)学校每天让学生长时间地学习,而且学习时间延续到周末。中国学生比美国学生在体育、音乐和其他与考试无关的活动方面花费的时间都要少。
云想衣裳花想容,假如没有天堂,那就带着梦想去流浪吧。dance in hell, die in heaven,live in world, love in dream