内容摘要:近年来,经合组织和欧盟大力推行“高等教育学习成果评估”、“培育优质教学”和“多维度全球大学排行”等国际评估项目,分别从学生、教师和高校三个层面对教育质量进行全面评价。本文在全面、准确地把握这些项目核心内容及最新进展的基础上,深入研究其内在的新理念、新标准和新技术,结合实际进行客观的利弊分析,并对我国参与行动提出具体可操作的建议。
关键词:经济合作与发展组织;欧洲联盟;高等教育学习成果评估;国际评估;质量保障
作者简介:
作者简介:李亚东(1961- ),男,江苏东台人,华东师范大学公共管理学院教授,教育学博士,研究方向为教育管理与教育评价,上海 200062;王位(1985- ),女,山东济南人,清华大学教育研究院博士研究生,研究方向为高等教育政策与管理,北京 100084
内容提要:近年来,经合组织和欧盟大力推行“高等教育学习成果评估”、“培育优质教学”和“多维度全球大学排行”等国际评估项目,分别从学生、教师和高校三个层面对教育质量进行全面评价。本文在全面、准确地把握这些项目核心内容及最新进展的基础上,深入研究其内在的新理念、新标准和新技术,结合实际进行客观的利弊分析,并对我国参与行动提出具体可操作的建议。
关 键 词:经济合作与发展组织 欧洲联盟 高等教育学习成果评估 国际评估 质量保障
随着高等教育的国际化,质量保障越来越受到国际关注,除了各国采用多种形式进行监测评估,国际组织也纷纷行动。围绕“学生到底学到了什么”、“教师如何提高教学质量”及“学校究竟办得如何”,经济合作与发展组织(Organisation for Economic Co-operation and Development,OECD)和欧洲联盟(European Union,EU)正在大力推行“高等教育学习成果评估”(Assessment of Higher Education Learning Outcomes,AHELO)、“培育优质教学”(Fostering Quality Teaching in HEIs,FQT)和“多维度全球大学排行”(Multidimensional Global University Ranking,U-Multirank)等国际评估项目(以下简称“三个项目”),以促进高校教育教学改革,加强国际高等教育质量保障,全面提高高等教育质量。
一、“三个项目”的核心内容和最新进展
1.AHELO:大学生到底学到了什么
AHELO项目被喻为“高等教育的PISA”,旨在对本科学生在毕业时掌握的学习成果(“学到了什么”和“能做什么”)进行评价,被定位为经合组织在高等教育领域最重大的标杆性项目。该项目自2008年启动,2011年6月至2012年12月在美国、加拿大、意大利、芬兰、俄罗斯、澳大利亚、日本和韩国等17个国家选取250所高校参与了可行性研究(试点);2013年3月在巴黎召开了AHELO项目可行性研究总结大会(笔者随教育部代表团列席会议),肯定了可行性阶段的实施效果和测量工具的有效性;2013年11月召开OECD教育政策委员会(Education Policy Committee,EDPC)全会,决定全面推行AHELO项目,计划于2016年进行首次正式测试,参与范围扩大至全部34个OECD成员国,并明确提出要“吸引更多OECD成员国以外特别是新兴经济体的参与。”①
AHELO包括共通能力(Generic skills)测试和学科专业能力(Discipline-specific skills)测试两类。目前,后者主要从工程学(土木工程)和经济学做起,计划到2020年扩大到13个学科专业领域(农学、商学、化学、土木工程、计算机科学、教育、历史、法律、数学、机械工程、医学、护理、物理),并将共通能力模块整合到所有测试类型中②。测试主要采取结构化反应任务(假设一个现实情境,设置大量开放性问题,要求学生用所学知识和技能,或测试时提供的各种信息和资源,发挥创造性思维去解决实际问题、得出结论或提出政策建议)和多选题的形式。共通能力测试主要测量学生的4项学习成果——批判性思维、分析推理能力、解决问题能力和书面写作沟通能力;工程学测试主要测量学生的5项学习成果——一般性工程能力、基本知识和工程科学、工程分析、工程设计、工程实践③;经济学测试主要测量学生的4项学习成果——学科知识及理解、运用知识解决实际问题、有效运用数据和定量分析、沟通交流④。除了上述测试,学生和教师还需完成背景问卷调查,结合背景问卷数据和学习成果测量表现,鉴别出影响学习成果的因素,并分析导致大学教育“增值”(value added)的原因,从而帮助学校判断应采取何种行动以使学生的学习成果最优化。
AHELO项目明确要求参与国设立项目总负责人(NPM)和国家中心(NC)来负责项目实施和协调。每个国家参与每种测试需要招募至少10所能够体现多样性和代表性的高校,每所高校随机抽取200名左右本科四年级学生参与测试和问卷调查。评估结果反馈表现在三个方面:一是给参与高校提供一份报告,内容包含本校参与学生的测试结果和整体测试结果,以及本校与本国所有参与高校的匿名对比,与全球同类高校的对比等;二是给参与国项目管理机构提供本国各参与学校的详细结果、与其他各国总体测试结果的比较等;三是每位参与学生还将获得个人测试结果。
2.FQT:教师如何提高教学质量
OECD自2007年起专门设立“培育优质教学”(FQT)项目,旨在通过制定科学合理的质量标准、提供高水平的指导和培训、总结推广优秀教学实践案例等方式,促进高校重视和改善教学工作,从而保障和提高人才培养质量。该项目是OECD创始于1969年的永久性教育计划——“高等教育机构管理”(Institutional Management in Higher Education,IMHE,迄今已有50个国家/地区的253家成员单位)的重要子项目之一,到2013年底已完成两轮试点,吸引了美国、加拿大、英国、芬兰、澳大利亚、日本、俄罗斯、巴西、印度及南非等20多个国家的50余所高校参与,取得了良好成效。FQT项目只面向IMHE会员,非会员无法单独参与。
FQT项目向参与高校提供质量框架(Quality Framework),即一套完整的教学质量评价标准体系。框架中的第一层级,是保障和提高教学质量的七大政策建议(相当于一级指标):①增强提高教学质量的意识;②发展培养高水平师资力量;③增进学生对教学的参与;④建立教学改革部门并培养教学质量带头人;⑤加强学校层面制度建设以培育教学质量;⑥鼓励和强化教学创新;⑦对教学效果进行有效评价。此下,进一步给出详细的实施要点(相当于二级指标),还有配套的薄弱点提要、自评细则及引导性问题和参考案例等,指导高校加强教学建设与管理,也可作为高校自我评估和外部评估的参考。项目组给参与高校“提供有效的政策策略和建议,帮助高校培育有质量的教学活动和实践,从而改善其培养质量及学习成果。”⑤同时,IMHE要求参与高校反馈自评信息和优秀教学实践案例,从而获取更多经验,不断完善其质量框架。
3.U-Multirank:如何全面评价高校办学水平
欧盟自2009年6月起力推U-Multirank,旨在打造一种“多维性、透明性、全球性”的全新排行体系。为此,专门设立了高等教育与科研绩效评价委员会(CHERPA,由CHE、CHEPS、CWTS、Elsevier、Folge3等多家研究及专业机构组成)负责项目的设计与实施。欧盟特别强调解决国际上现有各种大学排名的不足和弊端,譬如,普遍侧重于科研及英文论文发表数、以较容易获得的公共数据为依据、通过打分加权的方式排出“名次”、偏向“名校”而忽视绝大多数院校群体、与院校教育质量关联度较低、对院校改进质量管理和质量保障作用不大等等。U-Multirank实施五年来在国际上各类大学排行榜中异军突起、特色鲜明,迅速引起了国际高等教育界的关注。
U-Multirank的指标体系从四个角度进行设计:大学职能(教学、研究、以知识传播转化为主的公共服务)、大学定位(国际化、地区化)、运行过程(输入、过程、产出、影响)及用户需求(不同利益相关者所需要的信息)。指标体系设置五大维度(相当于一级指标):教学、科研、知识转化、国际化、地区参与。在此之下,“院校排行”设26项二级指标,“学科排行”则设38项二级指标。其数据来源有两个方面:一是现有文献专利数据库中的信息(“Web of Science”和“Scopus”全球两大文献数据库,PATSTAT全球专利数据库);二是使用电子问卷调查工具获取的院校自填报数据(院校数据、学科数据、学生调查问卷数据)。排行体现分层比较,分为“院校排行”和“学科排行”(目前只涉及商学、电子工程、机械工程和物理)两种形式。
U-Multirank与其他大学排名相比,不只是在选取指标和数据系统上的不同,它还强调“先分类、后排行”,而且在结果呈现方式上也更合理。U-Multirank与欧盟此前实施的“欧洲大学分类计划”(U-Map)和“欧洲大学数据采集计划”(EUMIDA)相互配套、一脉相承,分别侧重于“这所大学是做什么的”(U-Map)、“这所大学做了什么”(EUMIDA)和“这所大学做得怎么样”(U-Multirank),全面、完整地呈现了大学办学状况及其质量。在结果处理上,它并不是把数据信息简单地进行赋值加权求和后“排名”,而是直接面向用户提供个性化、多样化和直观化的“排行”比较。最终结果“排行”有四种方式:一是校际(或学科间)交互对比表;二是个性化(自选指标)定制排行榜;三是学校整体情况概览(森波斯特图);四是院校/学科指标明细清单⑥。整个数据检索、比较和排行的界面简洁明了,操作极为便捷和人性化,易于理解和使用。
2014年5月13日,欧盟首次正式发布了多维排行结果。此次排行评价了全球74个国家863所高校,1 200多个院系,5 000多个学习项目,采纳了6.2万余名学生的反馈。与以往大学排名按具体分数不同,多维排行结果以等级显示(共分A、B、C、D、E五个等级)。根据高校获得A、B、C、D、E的多少,按类似于奥运奖牌榜单的形式对其进行排行。除用户自选排行外,欧盟还公布了三类“定制排行”(Ready made ranking):“科研排行”、“经济参与度排行”和“商科专业排行”⑦。
二、“三个项目”的利弊分析
长期以来,各国对高等教育质量的评估主要是建立指标体系,监测教育投入、拥有资源和教育产出。从总体上看,经合组织和欧盟推出的三个项目,分别从学生、教师和高校三个方面全面监测评价高等教育质量,反映出国际高等教育质量保障的共同趋势,体现了国际高等教育改革的主流方向:一是更加强调以学生发展为本位。这不仅反映在AHELO项目直接评价学生的学习成果上,U-Multirank项目也强调“教与学”和学生满意度的调查;二是更加关注教学质量的生成过程,不仅FQT项目注重“培育优质教学”,AHELO项目侧重于测试学生应用所学知识解决实际问题的能力,U-Multirank项目也强调“教与学”活动本身;三是更加突出从多视角看待大学质量。U-Multirank强调对大学多种功能要从多维度进行评价,特别注重大学到底给学生带来了哪些变化和为社会做出了什么贡献。
对高校人才培养质量的评估,AHELO项目把目光投向教育产出,侧重于测试学生应用所学知识在新环境下处理信息、解决问题等方面的能力,有利于引导高校加强内涵建设和教学工作。同时,开发了评价学生学习质量的“统一尺度”,使得在全球视野下进行国际比较变成可能。参与国认为AHELO的测试结果有“四大用处”:一是有助于高校全面详实地了解本校的教学质量和学生的学习质量,以及本校与其他(全球范围)高校的差异;二是有助于政府了解高等教育质量状况,以及通过提供的国际经验对资源投资做出正确决策;三是有助于用人单位了解进入劳动力市场的毕业生将所学知识应用于行业实践的能力;四是有助于大学毕业生更加客观地了解自己掌握知识及实践能力的情况,为进入劳动力市场择业奠定基础。当然,AHELO项目要在全球推行也面临挑战:一是测量结果的客观性。测试内容能否真实、全面地反映学生的学习结果。二是试题呈现的公正性。统一设计的试题在不同文化和语言的国家如何做到公正。三是质量标准的多样性。如何处理各国大学生应该学习什么和怎样判断质量高低等见仁见智问题。四是结果反馈的效用性。测试结果对学校改进教学和学生改进学习到底能起到多大作用。当然,对于这些问题,专家们一直致力于不断改进。
提高人才培养质量,首先要提高教师的教学质量。FQT项目从教师入手着力“培育优质教学”,通过制定指导方针、开展培训、收集并分析院校教学信息,总结优秀教学实践案例等方式,并给出保障教学质量的一些具体建议。例如:建立教学与学习发展中心、提供专业发展机会和活动(教师培训)、专设教学创新经费、加强对学生学习的支持、学生评教和同行评价等。此外,还组织了“教学质量管理:怎样做才有用”专题研讨,出版《高校优质教学培育:政策与实践》,促进高校重视保障并提高教学质量。特别是该项目提出的七项政策建议,与我国目前开展的教学评估工作十分相似,当该项目负责人获悉我国“五位一体”本科教学评估制度的理念和做法时,热切期望我国高校参与FQT项目。这样既有利于中国高校教学质量在国际“质量框架”下得到提升,也有利于传播中国高校的“优秀教学实践案例”。由于该项目主要是向参与高校提供“质量框架”及相配套的指导手册,一些建议和具体实施主要依靠高校自主执行,外部推动力不大,如果参与高校内部动力不足,则项目实施效果就会大打折扣。







