让综合评价的理念在广州落地生根

 ——教育部专家组对广州市中小学教育质量阳光评价改革调研指导纪实

 

 

一、调研概况

为了解国家中小学教育质量综合评价改革各实验区的工作进展,指导实验区进一步推进综合评价改革,2015716日上午,教育部组织专家组,专程来到广州市教育研究院,调研指导国家中小学教育质量综合评价改革广州实验区的工作。

专家调研组由教育部基础教育课程教材发展中心副主任刘月霞带队,随行的专家包括:教育部基础教育课程教材发展中心评价处处长李水平、上海市教委教学研究室副主任纪明泽、江苏省教育评估院院长陆岳新、成都市教育科学研究院副院长秦建平。

参加调研会的广州实验区的领导和专家包括:广州市教育局党委书记、局长屈哨兵;广州市教育研究院党委书记、院长、二级研究员、博士生导师朱华伟;华南师范大学教授、博士生导师、广州市中小学教育质量阳光评价中标单位负责人张敏强;广州市中小学教育质量阳光评价改革工作小组成员胡志桥、钟阳、陈坪、邹立波、李柯柯、张海水、郑焕;张敏强教授阳光评价工作团队成员郭凯茵等人;来自区和学校的代表。会议由广州市教育局基础教育处副处长黄大谷主持。

 

二、调研过程及内容

调研会上,广州市教育局党委书记、局长屈哨兵同志首先致词。屈局长对专家组一行人的到来表示热烈欢迎和衷心感谢。随后,屈局长介绍了“广州市中小学教育质量阳光评价体系”改革的背景、广州基础教育的复杂现状及基础教育改革的工作进程。屈局长表示,广州市高度重视开展的国家中小学教育质量综合评价改革实验工作,分管的王东副市长亲自听取市教育局的汇报并作出指示,阳光评价改革工作被纳入到广州市委市政府的工作报告和重点督办工作。市教育局主要领导和分管副局长亲自挂帅担任实验工作领导小组组长和常务副组长,市教育研究院院长朱华伟同志任副组长。屈局长还表示,同时,广州市中小学教育质量“阳光评价”改革与广州开展的“好教育进行时”不谋而合,阳光评价就是衡量“好学生”的尺子,实施阳光评价改革,达到“观察学生、体察老师、洞察学校、督察政府”的目的。广州基础教育的“表情”比较复杂,因为单位合并、人员变动等因素,实验工作耽搁了一段时间,希望调研专家能就我市阳光评价改革帮忙“出点子”,提出应对策略和解决问题的有效方案。三年实验期结束后,广州的阳光评价工作将常态化,以“阳光评价”为抓手,使阳光评价在广州落地生根,促进基础教育阶段教育质量的整体推进和提高。

教育部基础教育课程教材发展中心副主任刘月霞首先感谢屈局长对本次调研工作的重视和支持,随后对专家组本次调研的目的进行了说明:按照教育部的要求,调研组下到各区开展调研工作,旨在查看各区工作进展状况,发现典型示范区,培植总结经验,打造模型并将其作为典型在全国推广。同时,也将发现各改革试验区工作中遇到的困难和问题,反观各实验区在工作推进中的不足,组织专家共同解决。广州处在改革开放的前沿,同时又有着深厚的历史积淀和改革经验,专家组对广州有期待,期待发现广州在阳光评价体系推进中好的经验和做法,打造广州经验,使其在更大范围内发光发亮。

调研的主体部分,是广州市教育研究院党委书记、院长朱华伟教授从七个方面汇报了广州市中小学教育质量综合评价改革实验工作进展:领导重视,规划先行,精心推进改革实验;协同创新,因地制宜,研制评价指标体系,;培训推动,谋求共识,加强专业能力建设;科研引领,上下联动,区域推进改革项目;经费保障,突破重点,探索持续深化机制;遵循规律,稳步推进,实验工作凸显特色。朱院长着重汇报了广州市的阳光评价具有的六大特色:阳光评价指标融入了国家正在研制的学生发展核心素养;评价指标加入了学校文化认同等具有地方特色的元素;继承了广州市开展学业评价的宝贵经验;初步开发出基于网络的具有认知诊断功能的自适应学业评价系统;试点了学生阅读素养抽测并发布报告;大力推进阳光评价进学科、进课堂。

华南师范大学张敏强教授主要从技术层面介绍了阳光评价工作的亮点和特色,包括“阳光评价”指标体系的制度、评价工具的开发、广州市基础教育学业质量监测系统云平台的建设,广州市五、八年级学生语文阅读能力测试四个方面的内容。阳光评价工作小组的成员郭凯茵博士向各位与会专家演示了广州市基础教育学业水平监测系统,包括在线测评系统、测试反馈系统和数据分析系统。张敏强教授还就本系统向专家组提出了三个问题:该系统是基于广州市的学业质量评价标准来研发的,是区域性标准,跟其他地区不一定融合;学业评价涉及到海量的学生个人信息和成绩等数据,如何确保数据安全;系统的研发是高技术含量的工作,目前的招标不一定能够选出合适的有实力的公司。

三、专家反馈

1. 上海市教委教研室纪明泽副主任

纪主任肯定了广州的实验工作。广州市推进改革的决心很大,让人看到了正能量和希望。广州的实验有三个亮点:具有认知诊断功能的学业质量命题模式;基于网络的学业评价分析模式;自上而下的引领和自下而上创新相结合的区域推进模式。

对广州进一步推进实验提出如下建议:

1)要关注数据的安全性。建议市教育局抓好顶层设计,专家团队具体组织实施,有些具体工作环节可以向不同的第三方购买服务,市局必须把数据安全的主导权抓在自己手里。

2)应理顺具有认知诊断功能的学业质量监测系统阅读素养测试,与阳光评价指标之间的关系。

3)从学生发展核心素养的角度建立指标和题库,是一个全新的导向,对今后的教育教学会产生很大的影响。而国内其他实验区很多都是从学科的角度开发工具和题库等。起到广州市在这方面有新进展,为全国实验区做出探索。

4)从实验推进的角度看,要关注“操作机制”的研究,指导和激发区、学校用好指标和评价报告,以体现诊断和改进的目的。这其中,教育行政的层面要研究如何将阳光评价的工作常态化的工作机制。

2. 成都市教育科学研究院副院长秦建平

1)要高度重视非学业的评价。这一块是课程的核心目标,是真正体现立德树人的部分,只有关注这一块,才是真正的综合质量评价,才能扭转以考试分数为导向的应试倾向。

2)要重视数据结果的应用。成都市把非学业质量量化,逐步建设基础数据和趋势数据,并用这些数据结果指导区和学校开展自我评价,真正发挥了评价的指挥棒作用。这一点上广州与成都可以开展合作。

3. 江苏省教育评估院院长陆建新

广州市有四点经验值得肯定:组织力度大、行政力度大,很多实验区做不到,像这种专业性强、难度大的工作,政府不可或缺;广州严格实施政府顶层设计、专家团队实施、第三方购买服务的模式,值得推荐,体现了管办评分离的思路;广州实验区的改革尊重规律,实施基于标准的题库建设,以科研课题带动,加强专业化队伍的建设,这些都值得坚持;部分区和试点学校先行先试,成果初步显现。

建议广州关注如下几个问题:

1)实验区的改革定位要清晰。本轮改革是基于学生全面发展的综合评价,所以学业和非学业的评价指标和工具开发都要深化,这一点武汉做得不错。

2)作为实验区,在体现地方特色的同时,执行国家方案要落实好,特别是评价指标和工具等。

3)在评价结果的使用上,要研究把评价结果如何跟中、高考对接,要重视评价的改进机制,通过评价诊断和改进教学。

4)要走国际化,广州可在国际化视野与国际评价机构合作上寻求突破,才符合广州这样一个城市的开放定位。

3. 教育部基础教育课程教材发展中心评价处处长李水平

广州有改革的动力,有一定的专业能力,有经费支持,有完整方案,政府推动的力度很大。建议如下:

1)广州的阳光评价指标与国家标准在文字表述和关键性指标上有很多不一致,能否在观测点或三级目标上体现教育部的标准?

2)广州的学业评价有深厚基础,要加强非学业指标的评价工具的开发。

3)广州的进展趋缓,希望中期评估和实验总结要有广州的介绍,成都、武汉进展迅速。

4)与教育部实验区办公室联络和横向实验区联系太少,关于实验进展的信息太少,广州做了很多事,要及时上报教育部。

5. 教育部基础教育课程教材中心副主任刘月霞

刘主任对广州的实验给予了充分肯定并寄语了很大的期待。她认为,广州的实验有顶层设计,重点依托专业力量,用课题研究带动学校和区域介入,鼓励区先行先试,学业评价上开发的学业质量监测系统(CD-CAT)以及阅读素养测试,都具有一定的先进性,实验有了一定的进展,只要这样坚持下去,广州有希望继续在实验区的第一梯队发挥引领作用。

刘主任建议如下:

1)建议根据教育部的文件和地区实际,进一步揭示“阳光评价”的内涵和价值追求,要把“阳光评价”这四个字在理论基础上演绎清楚,才经得住实践的考量,也才能复制和传播。

2)要重视非学业评价,这恰恰是教育部更关注的,非学业的指标、工具、平台才是值得努力的方向。现在各个实验区还是关注学业评价更多一些。

3)学业评价要做出新的特色。广州开发的学科学业质量评价标准丛书,还是具有一定的先进性的,走在了全国前面。但用今天的眼光看,总的感觉,更关注学科知识点的细化分解,评价点太迁就“人教版教材(考纲)”而不是真正依据课标。现在的课程改革趋势更重视课程内容的整合,关注学生发展核心素养。所以,建议广州市的义务教育阶段学科学业质量评价标准在接下来的修订中,要按照学科核心素养的思路来界定学业质量标准,不仅仅要关注学科知识掌握情况,更要关注学生核心素养的达成度。

4)广州在全面推进的同时,选择一些区和学校先行突破,面上的推进选某个或几个区全面先行先试,探索工作推进的模式模型。

5)对评价指标的界定和表述要坚持从学生发展出发,学生为主体的表达方式,前后一致,主体一致。

四、随同教育部专家组参加深圳实验区的调研

受教研院朱华伟院长嘱托,阳光评价工作小组副组长胡志桥主任随同教育部的专家组,全程参加了教育部对深圳市的调研指导,以进一步学习领会教育部专家组对推进综合评价改革的专业指导,并了解学习深圳市的先进做法。

深圳市的调研汇报工作主要由该市教科院院长叶文梓主持,该市教育局分管副局长范坤出席了汇报会议。叶文梓院长代表实验工作执行机构负责人,全面汇报了深圳市推进中小学教育质量综合评价改革的进展情况。各区派代表出席了汇报调研会议。

(一)深圳市实施中小学教育质量综合评价改革的主要内容及经验

深圳市教科院认为,教育质量应该包含四个层次:学生素养的质量、过程性的质量、学校的教育质量、国际比较视野下的教育质量。基于此,深圳的中小学教育质量综合评价改革主要设计了四个方面的内容。深圳市围绕这四个方面开展工作,分别如下

1. 实施阳光评价

1)论证并形成了提升深圳市中小学生8大素养的指导意见,明确深圳市中小学生需要具备的八大综合素养,即品德、身心、审美、学习、信息、国际、生活、创新等素养。颁布了《关于进一步提升中小学生综合素养的指导意见》的文件。

2)以8大素养提升行动来推进中小学教育质量综合评价改革,全面部署“四轮驱动”策略:构建新型课程(每一个素养都要有课程的支撑);构建阳光评价体系;培育教师新型育人队伍;发挥家庭和社会的积极作用。

320147月,与北师大中国基础教育质量监测协同创新中心签署协议,由该中心主持综合素养测试的工具研发、组织实施、数据分析、报告撰写、反馈流程等工作。

4)组织第一次阳光评价大规模测试。

201410月,对全市240所抽样中小学校,8万多学生、抽样学校校长、部分教师和近8万名家长进行阳光评价测试,测试内容包括学业测试和网络问卷调查。(据说整个测试流程完成,费用超过1000万)

测试对象与科目:五年级语文、数学、科学;九年级语文、数学、英语、科学、人文学科;高二语文、数学、英语、物理、化学、生物。

测试内容与形式:通过纸笔测试测查学生的学业能力,通过网络问卷了解学生的背景信息,问卷根据对象包括学生问卷、教师问卷、校长问卷和家长问卷。问卷调查的目的是分析学生素养发展的相关影响因素。

测试组织与流程:制定《考务手册》,安排巡视员考务巡视,以30人学生为单位组织考场,按照统一考试要求组织监考和巡视。网络测试则要求各不同对象在规定的时间内下载数据包,按时提交问卷。

测试数据处理:由北师大中国基础教育质量监测协同创新中心全权负责数据的汇总采集和分析,并发布测评报告。

5)发布了中小学生综合素养“阳光指数”测评报告。

6)下一阶段任务:探索新高考形势下学生综合素养评价新途径;利用大数据开展过程性的学业评价与综合素养评价;完善学生综合素养“阳光评价”三级体系,构建教育教学质量网络监测和管理体系;20159月组织第二次阳光评价测试。

2.开发“基于大数据技术的教育质量监测与评估系统”

1)由深圳市教育局与北京赛通网络技术有限公司联合开发。该系统属于跨学科、跨领域的大数据综合分析评价系统,包括前端的平台开发和后端的系统开发,涉及的技术包括智能文档技术、大数据分析、机器学习、人工智能、学科科学、命题研究等。特别是本次开发所采用的底层核心技术为全球领先的智能文档技术science word

2)该方案包括八大系统:教师命题客户端系统;试卷价值与水平评估系统;在线考试客户端系统;在线评卷客户端系统;大数据分析与评估系统;九大学科题库及数据分析系统;大数据管理系统(包括试卷评估样板库、试卷库、出题老师信息资料库、学生信息库、学生测试记录库);后台管理系统(管理各个数据库)。

3)依托该公司的技术和深圳市教育科学研究院的团队力量,对各学科的知识图谱架构、命题技术、学科思想、解题思路、学习规律等进行建构与设计。力争通过系统的开发与教育大数据分析为深圳市的教育提供决策与参考,为培养学生提供科学的个性化解决方案。

3. 继续开展义务教育阶段办学水平评估

12011年,深圳市开展了以帮助学校升华经验、诊断问题、创新发展为目的的义务教育阶段办学水平评估。

2)评估设计了领导与管理、课程与教学、教师发展、学生发展等5个一级指标、15个二级指标、38个三级指标,而学校的硬件设施、空间布局等物质要素则退居为背景。

3)评估由督导部门、高校、教科研部门等联合实施,包括学校自评与督学评估等环节构成。

4)该评估的一个重要特点是评估的常态化和情境化,关注师生的现场表现和直接信息,做到“让事实依据,以数据支撑”,评估报告以“呈现+判断+问题清单”形式反馈给学校和社会公众。

4. 参与Pisa2015测试并申请Pisa2018测试,借鉴国际先进的教育评价模式,检验和提高深圳市基础教育发展水平。

(二)实验中的困难与问题

1. 如何客观准确评价非量化质性的教育目标所要求的素质?

评价=测量(量的记述)或非测量(质性记述)+价值判断。

量的记述往往通过标准测验和客观测验来实现,重点考查智力和能力,但是学生的综合素质很多是难以量化测验的,而必须依赖于质性描述,如何确保质性记述的客观性、可靠性和典型性?

2. 怎样测验认知目标中分析、综合、评价等较高要求的项目(基于新的布鲁姆教育目标分类学)

3.怎样测评情感领域和动作技能领域的目标?

4.能否给予实验区升学方面的特殊政策?(现有的测评与中高考脱节)

5.如何做到评价指标体系的本土化?

6.如何使评价工具和评价结果的分析评价更科学化?

7.如何使评价结果的使用更合理、更科学?(缺常模)

8.如何确定测试的适度规模?

(三)教育部专家组对深圳实验区的反馈意见

1. 成都市教科院副院长秦建平

1)综合评价与课程标准是一致的,以评价为抓手,是真正起到落实课程,落实素质教育的目的。所以,深圳市提出让每一个学生素养都要有课程的支撑是正确的。至于有学校提出的关于课程与课时的矛盾,因为在整个课程设计中,有些是隐性课程,这个矛盾是能解决的。

2)深圳提出的学生素养八项指标与国家五项指标的关系要理顺,一定要落实国家的指标,再后创新,实验区的一个重要任务就是要落实好国家综合评价改革方案。

3)评价结果怎么用?如果要等到招生后再搞综合素质评价就迟了,建议先做,积累数据,取得学校和社会的信任,有了公信力,招生部门会就会采用。所以,做好这件事,对国家招生考试制度改革的推进,落实立德树人的根本任务是具有深远意义的。

2. 上海市教委教研室副主任纪明泽

1)学生的8大素养阳光评价与义务教育办学评估及教师评价这三个方面要从顶层设计,理顺关系。

2)上海通过绿色评价,达到对学校而言“不焦虑、淡定;不突击、常态;不作假、客观”。建议深圳市市一级层面要做好领导,顶层设计与统筹协调。

3. 江苏省教育评估院院长陆岳新

1)中小学生8大素养的提出有深圳特色,评价架构完整,委托第三方机构开展测试也符合目前的政策趋势。

2)感觉深圳推进实验强调地方因素多,落实国家实验区要求少(规定动作少)

3)建议在工作策略上:在高处站,做好顶层设计;在实处做,要落实好;在深处行,要依靠专业化、科学化力量寻求突破;在宽处用,让学校、老师、社会受益于评价改革。

4)建议教科院作为专业机构,要更主动介入到这个工作,不能仅仅委托给第三方,否则自身的专业能力和专业力量建设不起来,以后就难以实现综合评价工作的常态化。

4. 教育部基础教育课程教材发展中心评价处处长李水平

1)深圳的实验工作进展正常。

2)国家提出的规定动作要落实,深圳的设计过于突出地方特色。

3)两个惊讶:(1)评价报告拿出来太晚了,感觉不够自信,不敢拿出来给专家组;(2)对实验的畏难情绪,难以看到深圳特区人的改革激情。

4)处理好几个问题:与国家标准的关系、与办学的关系、与学业的关系、学业评价与非学业评价的关系、与pisa的关系、8大素养提升与评价之关系、通过专业能力建设培养自己的评价专业人员、思想要更开放些、报告的专业性有待加强。

5. 教育部基础教育课程教材发展中心副主任刘月霞

1)这项工作专业性强,从激情回归理性是正常的。

2)深圳对教育质量有正确认识,能基于学生素养认识教育质量,从小学到高中,8大素养覆盖了学业与非学业,有整体设计,依托专业力量,与北师大和中国基础教育质量监测中心合作,进展顺利。

38大素养有待严谨论证,各素养之间的相关性、内涵、关系,以及与国家指标的关系需要说清楚。

4)要理清8大素养与课程、教学、学校办学及教师发展之间的关系,素养的形成是一个综合复杂的过程,要把每一个学科课程背后的对应素养研究揭示出来,学科课程能承载什么功能需要揭示出来。

5)要进一步理顺学生评价、学校评价、区域评价之间的关系,感觉深圳的摊子铺得很大,但是缺乏集成,有割裂感。

6)学生综合素养的评价应更多依赖质性的、过程性评价,而不能夸大量化评价的作用,否则效度存疑。

7)目前看到的阳光指标测评报告只是一个结果报告,还没有真正呈现影响教育质量和学生素养的因素,归因分析不够。

8)要加强本土的专业力量建设(机制办法),福田区的做法值得推广(福田区教研中心)。要加强对校长、教师、专业人员等涉及各方面要加强培训,否则报告都看不懂。

五、对广州市进一步推进阳光评价改革的思考

调研是一个契机,可以通过自我总结、专家研判和同行比较,更全面、更客观地审视广州实验区推进阳光评价改革的工作。根据本次调研和广州实验区的工作方案,就做好下一阶段阳光评价改革工作,提出如下建议。

1. 进一步完善实验方案的顶层设计。主要包括三点:

一是从学术理论的层面厘清“阳光评价”这一核心概念,要在学术层面立得稳,在社会公众层面传得开。

二是进一步论证阳光评价指标六大评价内容、22项关键性指标之间的整体相关性,正确处理好阳光评价指标与教育部指标之间的关系。

三是在市教育局的层面做好市区校的协调、经费保障、数据安全等方面的顶层设计和统筹实施。

2. 在实验工作内容上加强难点问题的研究解决。主要包括三点:

一是继续走在全国前列,以学生发展核心素养思想为指导,启动义务教育阶段学科学业质量评价标准的修订,逐步建立基于学生学科核心素养、依据课程标准的学业质量评价指标体系,并完善已经初步成型的具有认真诊断功能、基于网络的基础教育学业质量监测系统。

二是与广东省心理学会合作,加强对非学业评价指标监测点的界定和论证、测评工具的开发与检验等工作。

三是与广东省心理学会合作,加快建设阳光评价云平台。

3. 进一步完善实验工作策略和区域推进机制。主要包括三点:

一是持之以恒地加强自身专业能力建设。要通过与第三方专业机构的合作、继续教育培训、骨干教师培训等途径,逐步建立我市专职兼职相结合的评价专业人员队伍,为今后阳光评价工作的常态化提供保障。

二是抓紧市科研规划课题和市教育研究院立项课题的研究推进,凝聚全市力量,重点解决阳光评价实验中的有关理论和实践问题。

三是抓好试点学校(每个区十所学校)和试点区域(三至四个区)的管理,鼓励这些学校和区域按照全面的要求先行先试,一方面寻求重点的突破,另一方面探索区域整体推进的工作策略和机制,形成改革实践模型,将来才能在更大范围内全面推进。

4. 2015年下半年,重点做好以下三件工作

一是按照工作方案以及招标合同,完成有关评价工具研制、试点区和学校的试测以及发布报告。

二是与中国教育学会合作,开好面向全国同行的阳光评价研讨会。

三是准备接受教育部组织的对全国各实验区的中期检查。

 

本次调研会犹如及时雨,专家组的调研工作一方面促进了广州实验区加强对已有工作的反思,另一方面也对广州实验区今后的工作提出了更高的要求。广州实验区应努力把中小学教育质量综合评价改革工作做好、做大、做强,使“阳光评价”项目在全国30个改革实验区中创强争先,树立良好的品牌形象。充分利用评价结果,使评价结果服务于政府行政决策、学校教学整体质量的提升、教师教学改进、学生学科素养的培育,形成政府支持、学校、教师、家长、学生认可、社会各界广泛参与的良好格局,使多方受益。同时,广州市将充分利用新闻媒介,加强与教育部的联系、与全国各实验区的联系,通过多种形式,报道广州推进阳光评价改革的进展和成果,全面宣传中小学教育质量综合评价改革的意义,引导社会和家长树立科学的教育质量观,营造全社会支持和关心中小学教育质量综合评价改革的良好氛围。