2017年12月20日 星期三
在世界各国对普遍对PISA保持高度关注的今天,你是否了解PISA究竟是如何来的?PISA到底考哪些科目?为什么PISA测试能保证其客观、公正与科学性?这篇文章将为你揭秘PISA的“前世今生”。
PISA的“前世今生”
黄泰辉 编译

    PISA到底是怎么来的

    随着知识经济时代的到来,世界各国对于解决“如何实现对本国人才培养质量的有效监控,引导教育健康持续发展”“如何从国际比较角度评价一个国家教育的总体质量,进而推动和完善一国教育政策和制度”等问题的需求越来越迫切。但与此同时,原有的评价体系缺乏国家间共同认可的指标,特别是在知识和技能方面的测评缺少可信的数据,这使得各国都期望有一套可靠的、具有国际比较性的工具来评估本国教育体系。

    为了回应这一需求,经济发展与合作组织(OECD)于1995年提出了PISA项目,并在1997年正式启动该项目。经过长达数年的研究和试测,OECD最终确定了PISA调查的框架。PISA主要测评即将完成义务教育的15岁学生在多大程度上掌握了全面参与社会生活时所需要的终身学习能力和问题解决能力,具体聚焦在阅读、数学和科学等关键领域的素养上。

    2000年,PISA开始了第一轮测评。此后,每3年评测一次,每次从阅读、数学和科学领域中选择一个科目作为主要评估领域,另外两个作为次要评估领域,每9年完成一个循环。PISA不仅深入评价学生应用知识解决实际问题和学习新知识的能力,还评价学生的阅读参与度和学习策略。截至2015年,OECD已经完整实施了六轮PISA测评,参与国家也由第一轮的32个国家和经济体增加到2015年的72个国家和经济体。我国教育部考试中心于2006年引进并启动了PISA2006中国测试项目,上海于2009年加入PISA测试,并在PISA2009和PISA2012中总分排名第一,而由北京、上海、江苏和广东组成的中国部分地区联合体(B-S-J-G,China)在PISA2015中总分排名第十。

    PISA究竟考了些什么

    PISA的测评框架由参与国专家共同设计,设计草案经过PISA理事会审定通过方能实施。总的来说,框架从4个方面界定各领域素养测评的维度:学生应用所需各学科领域的知识、学生应用所需各学科领域的能力、学生遇到的问题情境和学生对学习的态度和倾向。具体的测评内容如下:

    •阅读素养

    PISA2009对阅读素养的定义是“为实现个人发展目标、增长知识、发挥潜能并参与社会活动而理解、使用、反思书面文本并参与阅读活动的能力”。除了对文本的解释和理解之外,阅读素养还涉及对材料的解释、反思以及运用阅读技能实现个人生活目标的能力。PISA强调的阅读素养重在为了学习而阅读,而不是为了阅读而学习,因此并没有对学生最基本的阅读技能进行测评。PISA2009阅读材料的形式包括:连续性文本,如议论文、说明文等;非连续性文本,如图表、清单等;混合文本,即包含连续和非连续性两种文本;多重文本,指为了特定目的而并列呈现的几个独立文本。PISA对学生阅读能力的测评主要通过不同的阅读任务和过程实现,比如PISA2009阅读考察的类型有:访问和检索、整合和解释、反思、评价以及综合。

    •数学素养

    PISA2012对数学素养的界定是“个体在各种背景下运用和阐释数学的能力”。它包括数学公式的推理,使用数学概念、工具等描述、解释和预测现象。它能够帮助个体认识数学在现实世界中所起的作用,作出有根据的决策和判断,以便成为具有建设性、参与意识和反思能力的公民。PISA2012对数学知识层面的测评包括:数量、空间和图形、变化和关系、不确定性和数据等4个方面。通过设置不同的数学任务或过程对学生的数学表达、数学运用和数学阐释等能力进行考察。与阅读素养类似,PISA2012将数学应用领域或情境聚焦在与个人、社会和全球背景有关的应用上,如个人的、社会的、教育和职业的,以及科学相关的情境上。此外,PISA2012还测评了学生的学习驱动力和动机、学习数学的信念以及学生对数学活动的参与程度等。

    •科学素养

    PISA2006将科学素养定义为个人在以下几个方面发展的程度:(1)掌握科学知识并运用科学知识识别问题、获得新知识、解释科学现象,对与科学有关的问题得出基于证据的结论。(2)了解科学如何探究人类知识及其自身特点。(3)意识到科技怎样影响我们的物质、精神和文化生活。(4)作为积极思考的公民,参与科学相关议题,并具备科学观念。科学素养要求学生能够理解科学概念,应用科学观点,并且对证据进行科学思考。PISA2006也从知识、能力、情境、态度和倾向来测评学生的科学素养。知识层面,PISA区分了科学知识和关于科学的知识。PISA通过不同的科学任务和类型来测评学生识别科学议题、科学的解释现象、运用科学证据的能力。

    •问题解决素养

    PISA2003新设了问题解决素养来评测学生解决现实生活中问题的能力。问题解决能力是指个体运用认知过程来面对和解决真实的、跨学科情境问题的能力。PISA问题解决能力的测评主要是从问题的情境、问题情境的性质和问题解决过程三个维度开展的。问题情境分为技术和非技术情境,问题情境的性质包括交互问题情境(如线性结构方程)和静态问题情境(分为定义良好的问题和定义不明的问题)。问题解决过程可以分为探索和理解、表征和表达、计划和执行、监控和反思4个过程。此外,PISA2015将问题解决素养改为协作问题解决素养,将原本的“个人的”问题解决素养转为“合作的”问题解决素养,并且通过计算机化测试丰富了测评内涵,提升了对问题解决素养测评的准确性。

    •财经素养

    财经素养是PISA2012中首次增加的领域,旨在测评学生在财经知识、风险、能力、动机等方面以及运用财经知识和技能应对一系列复杂财经事务,进而提升个体和社会财经幸福指数和参与度的水平。PISA2012对财经素养的测评主要从情境、知识、过程和能力三个方面开展。财经素养的情境包括教育与工作情境、居家与家庭情境、个人生活和社会活动情境。财经素养的知识领域包括货币和交易、规划和理财、风险和回报、金融环境等。PISA测评的财经能力主要包括识别财经信息的能力、分析财经背景信息的能力、评估财经问题的能力、应用和理解财经知识的能力等。

    PISA是如何组织考试的

    PISA项目从试题的编制到正式施测,以及评分与结果的解释都有非常严谨的质量保证程序,以此保证PISA测试的可靠性和科学性。

    •PISA的测试工具

    由PISA管理委员会、国际联合处、OECD秘书处共同制定测评的指导原则,并挑选阅读、数学、科学等领域的专家参与设计测评的框架并指导PISA问卷的制定。每个参与国或地区都可以提交具体的测试问题,并交由国际联合处和各参与国(地区)审阅,无异议题目入选试题库。正式施测之前,筛选的新题和使用过的题目都会参与所有参与国(地区)的试测,根据试测结果进行调整和修改并确定正式测试所用的试题。正式试测前还要求参与国(地区)的专家翻译成本国文字,学生用本国语言作答。

    •抽样方法

    PISA采用按照概率与抽样元素的规模大小成比例抽样法(PPS抽样),以所有测试时年龄在15岁3个月到16岁2个月之间的在校学生作为样本。不考虑学生所在年级与教育机构,也不考虑学生接受的是否为全日制教育,但样本不包含未在教育机构就读或者在国外上学的15岁学生。PISA允许参与国(地区)剔除不具备测试条件的学生(如智力障碍和严重功能性残疾)。为保证数据可靠且具有国际比较价值,PISA规定每个参与国或经济体至少抽取150所学校的4500名学生(每所学校不得少于20名)参加核心项目的测试。要求学校的参与率达到85%,否则从替补学校中取样以达到要求,学生的应答率要求达到80%。

    •试卷及测试形式

    PISA2012的核心测评领域为4个:数学、科学、阅读和问题解决,其中问题解决采用计算机测试。此外还有两个国际选项:财经素养(纸笔测试),计算机化阅读和数学测试。素养测评的时间为2小时,但由于题目组合不同,总测评时间约为390分钟。测评需要在学生就读的学校内进行,且每次测评的重点领域测试时间占总测试时间的三分之二。计算机化阅读和数学测试所用时间约为40分钟,学生还要花30分钟完成一份关于个人信息和家庭信息的问卷,校长也要完成一份关于学校信息的问卷,耗时约20分钟。测评主要分为两部分:素养测评、个人背景与学习情况问卷。素养测试题目由问答题和选择题相结合组成,题目以单元的形式组织。每个单元包含一段文字或一个图表,均为学生在现实生活中可能遇到的问题。此外还有教育职业问卷、计算机熟悉程度问卷以及家长问卷等3个选择性问卷。

    •测试评分及结果报告

    PISA对于测试的评分方法及过程有严格的把握,为了保证测试的可靠性和国际评分的公平性和一致性,PISA设计了试题本轮转程序、评分培训、分类计分、多次计分、评分检查等质量控制环节。PISA在试测和正式测试之前都会组织评分专家参加国际培训,并由参与国际培训的专家对本地专家进行培训。PISA先将答案进行分类,划分等级、编码,随后将编码录入数据库管理软件交由经合组织,并由经合组织统一将编码转化为标准化分数。PISA测试的选择题由电脑自动计分,简答题、问答题由专家评分,评分和计分独立分开以此保证尽量客观。一般情况下,在PISA测评结束之后的第二年下半年,会由OECD秘书处提供一份详细的包含PISA全部评估结果的报告。

    我们要向PISA学些什么

    自2006年教育部考试中心引进并启动PISA以来,无论是中国的公众、研究者抑或是政府官员,对于PISA的关注度都有增无减。特别是PISA2009和PISA2012上海测评总分在世界排名第一,引起世界范围内对中国教育的关注,更是引发了民间和官方学习中国教育模式的热潮。能够在PISA测试中取得好成绩,不仅向世界展示了中国基础教育的质量,也证明了我们的教育工作者、教育政策等确实有其可圈可点之处。但是在风光背后,我们不应忽视在PISA测试中反映的我国学生在阅读、问题解决等领域存在的一些问题。PISA测试应该成为我们检视和反思教育现状、改进教育政策、提升教育质量的重要参考。

    目前,我国也进入了全面提高教育质量的阶段,如何开展科学、可靠、高效的教育评价,充分发挥教育评价在促进教育质量提高的作用,促进学生健康发展,保障我国教育管理和教育决策科学化,PISA测试以及相关国家的改革为我们提供了有益的借鉴和启示。

    •构建更加公平的教育体系

    PISA关注的不仅是学生核心领域的成绩,还通过学生、家长和学校问卷等探究影响学生学业成绩的背景因素。报告发现,城乡差异、社会经济差异、教育投入差异等均会不同程度对学生学业成绩产生影响。近年来越来越多的国家和地区对教育体系进行了改革,使其更具公平性。如英国政府鼓励优质学校和薄弱学校合作,希望据此提高教育的整体水平,澳大利亚、奥地利、波兰等国家对学前教育进行大量财政投入,将学前教育纳入公共财政支持范围,同时还设置了学前教育办学标准,规范学前教育机构办学,保证学前教育质量。针对我国目前教育资源分配等领域出现的公平性问题,这些国家的改革为我们提供了有益的借鉴。

    •建立符合中国国情的教育评价体系

    目前,我国的教育评价体系仍然存在着评价科学性、合理性不足,评价滞后、评价片面等问题。要建立符合中国国情的教育评价体系,一是要借鉴PISA先进的评价理念、科学的评价工具、全面的实施流程及严谨的评价方法,探索建立适合我国国情的教育评价模式。同时还应该变静态的教育评价为动态的教育评价体系,关注教育质量的变化趋势,跟踪教育的发展趋势,为教育政策的调整、学校教育质量的提高提供较为科学的支持。此外,还应该促进评价对象以及评价内容的多元化,变单一的学生评估为包含家长、管理者、教师、学生等教育利益相关者在内的多元评估体系,建立学校间、地区间的评估数据库,便于学校基于评估数据进行教学改进,提高教学和管理质量。

    •重视学生的全面发展

    从PISA的指标体系和测评框架看,PISA一直关注的是学生的素养,而不仅是测验的最终分数。因此在实际的教学和评价中,应该逐步转变分数导向的教学和评价方式,更加关注学生阅读、数学及科学素养的培养,重视理论知识与实践能力的协调发展,通过创新教学方式,如变传统“教师中心”的课堂为“学生中心”的课堂等培养学生的综合能力,通过设计更加合理、贴近现实情境的试卷对学生进行评价,同时对学生进行表现性评价,使评价真正有利于促进所有学生的全面发展。此外,PISA评价学生的指标并不是静态、固定的,也是不断发展变化的。教育评价应该有助于促进学生认识到自身发展的多种可能性,并有助于促进学生的全面发展。

    (作者单位系北京师范大学国际与比较教育学院)

中国教师报