基础教育的质量监测重在质量管理|基础教育质量监测

基础教育的质量监测重在质量管理

基础教育的质量监测重在质量管理 基础教育的质量监测重在质量管理范文 国家中长期教育改革和发展规划纲要(2010-2020年)》 (以下简称《教育规划纲要》)把提高教育质量作为教育改 革和发展的核心任务,提出要制定基础教育质量的国家标准, 建立健全教育质量保障体系。《教育规划纲要》中关于基础 教育质量标准及其监控问题的相关精神,成为中国教育学会 基础教育评价专业委员会2011年“基础教育质量监控”专题 研讨会的研讨主题。研讨会共收到50多篇主题论文,并邀请 国家教育督导团办公室副主任林仕梁、北京教科院院长时龙、 上海浦东教育发展研究院原院长顾志跃等专家,就国家在基 础教育质量监控方面的思考和工作推进、中国教育质量标准 的框架性思考和教育质量监控技术等问题做了专题报告。重 庆教育评估院院长龚春燕和北京教科院基教所所长赵学勤 分别介绍了两地开展基础教育质量监测工作的情况。

本次专题研讨会的论文和专家报告表明,我国在基础教 育质量评价、检测和监控的研究及实践方面已进入了一个新 的发展阶段。

一、看待基础教育质量标准及检测或监控的不同视角 基础教育的质量、质量标准、质量评价、质量检测或监 控等,是与会者共同关注的基本问题。大家从多种视角看待 上述问题。特邀报告多为宏观视角。专题研讨会论文的视角 可分为理论的、区域的和学校的三个层面。基础教育质量包含的内容过多。办学质量、师资质量、 课程质量、教学质量、人的全面发展质量等,都是基础教育 质量必须包含的内容。观察基础教育质量的立场和角度也太 多。宏观、中观、微观,理论、实践,历史、现实、未来, 政府、社会、学校、家长,不同视角的观察,获得的结果和 结论有所不同。特别是对于基础教育质量、质量标准的看法 存在很多差异。

特别需要澄清的是,监控意义上的基础教育质量,指的 是教育的质,而不是教育的量。质的意义上的教育质量,对 应着以课程标准为核心的明确的标准(课标),与课程标准 相对应的评价(监测或监控)只能用达标与否来表示。也就 是说,质的意义上的教育质量,只有一个质的标准,判断的 方法,就是看其是否完成了这个任务、达到了这个标准。《教 育规划纲要》提出的建立国家基础教育质量标准,就是质的 标准;
建立基础教育质量监测或监控机制,就是通过恰当的、 适用的评价形式,保障全国基础教育都能够完成教育任务、 达到教育标准。

量的意义上的教育质量对应的是教育结果(有时还延伸 到教育过程)的优劣程度。通过恰当的、适用的评价方法, 对教育优劣程度作出判断,将不同地区、学校及教师的教育 教学质量水平区分出来,能够给学校或教师的工作质量的高 低或优劣进行排名。所谓“不断提高教育质量”,指的就是 这种量的意义上的教育质量。将质和量加以区分,有助于梳理对质量监控的认识,也 便于质量监控工作的操作,在某种意义上还有助于对社会和 大众的宣传。质,是达到目标,并且是百分之百达到。量, 是“更高”、“更好”、“更多”、“卓越”、“优质”。

政府、学校和教师的法定任务是完成质的目标,学校和教师 在完成质的目标的基础上,可以努力达到更高的质量,但那 不是当前质量监控的重点。质量监控,首先是质的评价和保 障,其次才是量的追求。

基于不同的目的,质量监控应采用不同的评价形式;
使 用评价方法不同,获得的评价结果就不一样。测查教育质量 的高低、好坏、优劣程度,适用于相对评价方法。相对评价 方法的基础是群体均数、常模之类的客观标准。监测或监控 基础教育质量是否达标,适用于绝对评价方法。绝对评价的 基础是制订基础教育质量标准,比之“常模”,这种标准带 有较强的主观性。基础教育质量标准是以课程目标为核心而 确立的学校、教师和学生必须达到的教育和学习目标。通过 绝对评价,可以准确而高效地监测或监控质量目标的完成情 况。至于在实现标准之后,如何追求更高的、卓越的、优质 的教育质量,就不是教育质量标准所关注的问题,因此也就 不是教育质量监测或监控所应考虑的问题了。倘若在讨论制 订基础教育质量标准问题时,不能在理论上和思维方式上剔 除“更高”、“卓越”、“优质”这些旨在反映目标标准之 上的量的提升情况的修饰词,就容易在质和量的问题上出现摇摆,就容易说不清基础教育质量监测的任务究竟是为了改 进工作,还是为了给地区和学校乃至教师和学生进行排名。

研讨和论文中还涉及两个基础性概念,一个是监测,一 个是监控。厘清这两个概念也有助于推进对基础教育质量问 题的研究和实践。这两个概念涉及测、监、控三个字,分别 具有不同的含义。测,是方法和技术,是手段,表现为测量 工具的开发和应用;
监,是实时掌握和了解质量状态,是对 质量的充分把握、切实把握,表现为一种常态化的运作机制 建设;
控,是控制教育质量和保障教育质量,表现为一种使 基础教育尽快达到国家标准的保障制度建设。基础教育质量 监测是以质量标准为基点,测查教师的教学和学生的学习是 否达到了目标。当然为了保证教师的教学和学生的学习,需 要监测的还有学校的管理及其他教育质量的主要影响因素。

建立一种质量控制的机制,以保证基础教育能够完成教育标 准。在当前我国的教育体制中,督导或督学制度是实现监控 的主要途径之一。测在前,控在后,测是技术的表达,控是 制度的表达。监控比之监测,多出来的正是对质量保障制度 的诉求。

二、从量的评价转向质的评价,从相对评价转向绝对评 价 制订基础教育质量标准,是开展基础教育质量检测或监 控的逻辑前提。依据质量标准而实施的评价属于绝对评价。

我们要开展质量监控,首先需要实现评价观的转变。近年来,社会普遍信服客观标准,相对评价属于比较偏重于客观标准 的评价(常模),绝对评价则偏于主观,但是质量监控需要 的恰恰是要制订一个适合当前工作状态的主观标准(人为制 订)。

从宏观角度看,在国家和一个相对大的区域层面,需要 有意识地排除通过评价给地区和学校排序、评比的做法。宏 观层面所谓转变评价观念,就是要强调基础教育质量监控的 是质而不是量,是教育目标的完成情况以小学语文课程为例, 课程标准对识字数量是从学生认识的字数和会写的字数两 方面来要求的,学生认识的字数在第一学段增幅为1600字~ 1800字,会写的字数在第一学段为800字~1000字。这两个 数字构成了教育质量的监控标准。但是有些地区和学校,把 标准中的“一会”提高为“两会”(不仅会认,还要会写1600 字~1800字,超标一倍),“两会”再提高为“四会”(会 认、会写、会读、会用),对于这些做法,我们应该给予什 么样的评价呢?给予“达标”,似乎不足以说明其质量的“高 超”程度,给予“良好”和“优秀”,则又非质量监控的本 意,也不是课程标准的本意,甚至还可以说是对课程标准的 某种僭越和批判――要求二年级的教师和学生完成四年级 的任务――课业负担就是这么被加重的! 对于学生及其家长而言,认字越多越好,这是量的评价, 是相对评价的任务;
对于学校、教师及政府而言,完成课程 标准就好,这是质的评价,是绝对评价的任务。识字教学这个例子说明,可以“不断提高”的,只有量,没有质。

当然,一般来说,宏观和微观视角中的教育质量监控的 实际含义多少有所不同。

宏观、中观的视角,重在监控底线,须用绝对评价方法。

微观的视角中,重在考查程度,既可用绝对评价方法,也可 用相对评价方法。假如以15秒为学生百米跑的速度标准,代 表体育教学目标,那么我们可用绝对评价方法予以监控。凡 15秒以上者为达到目标、完成任务、质量合格。但对于14秒、 13秒、12秒、11秒的学生是否就意味着质量很高?要不要更 高?在宏观和中观视角中即绝对评价中,后面的问题都不成 立!只有在微观视角中,才可以说,跑11秒和15秒之间意味 着什么差异。美术、音乐等艺术和技能性课程都如此,知识 性课程、道德性课程同样如此。比如:学生做志愿服务或社 会实践的时间,20课时为达标、合格。可以倡导或鼓励个别 学生争取30、40个课时,并予以表扬,但不能作为质量标准。

换言之,质的评价,是针对15秒、20课时的达标性评价。它 不太关注14秒、13秒,30课时、40课时的问题,相反,它非 常关注16秒和19课时所反映出的教育教学工作问题。

及存在的问题。基础教育质量监控的“达标”性质和“保 障”目的,决定了绝对评价是比相对评价更加适宜的评价方 法。

从微观角度看,由于绝对评价依据的是教学目标,是一 种质的评价,因此它有助于我们发现教学中的问题,其结果对于改进工作具有重要价值。而相对评价依据的是群体均数, 是一种量的评价,它有助于发现个人差异,其结果具有很客 观的评比、排名作用。所谓转变评价观念,就是依据提升教 育质量的目的,微观层面的学校和教师,都应该将适应于“完 成既定教学任务,发现教学中存在的问题以便及时改进”的 评价方法作为主要方法,而压缩和减少使用相对评价方法。

无论宏观角度的监控还是微观角度的监控,都应遵循把 握教育质量的“质”这个逻辑原则。《教育规划纲要》中提 出的制订基础教育质量标准所预示的对应的评价性质是质 的评价,对应的评价技术是绝对评价。如果说我们曾经在新 课程改革过程中一度比较重视应用相对评价的技术和方法, 如比较重视课程及教学目标的生成性,重视研制各种常模, 以便于评价每个孩子(与群体均数相比)的发展情况,那么, 国家层面所要监控的必定是教育教学目标的达成程度。相对 评价一般使用等级分数,自然能够评出名次;
绝对评价一般 使用达标线,只能分出是否达标,而不能细分名次。

当前,基础教育质量评价面临的问题是多方面的。

重量轻质,并把量当成质,是当前的一个主要问题。当 我们把一个本来有目标、有标准的事物由于美好的愿望而有 意抹杀其质的标准,使之变为一个具有无限弹性的事物时, “不断提高”这四个字,就从愿望性的口号变成了现实政策。

在“不断提高教育质量”的观念下,是无法确立和制订质量 标准的。没有标准,便无法确定恰当的、适用的评价方法;
没有明确的评价方法,便没有切实的监控。“不断提高”只 是此类愿望性口号的代表,实践中还可以看到花样翻新、五 光十色、丰富多彩的不断创新的概念说法(优质的、卓越的、 高标准的、可持续发展的学生等)。这些说法的目的并不在 保障教育质量方面,而仅在于如何“不断”提升名次,以达 到“出人头地”的目的。在几篇介绍香港基础教育质量监控 的文章中,我们也可以清晰地看到这样一个转向的趋势:基 础教育质量监控的评价从重视输入、过程,向重视结果方面 转化,从重视量向重视质方面转化,从重视“虚”向重视“实” 方面转化,从权力控制向评价监控方面转化。

有论文鉴于目前流行的评价方法对教育质量的结果评 价只有好坏、优劣、高低这样的表达方式,而提出用模糊综 合评价模型来处理这个问题。这在实践中也是一种被大家普 遍接受的方式。但是,在好坏、优劣、高低之前,还存在一 个“是否”、“有无”的问题,而“是否”和“有无”所针 对的,恰恰是基础教育质量的标准所在,是质量的“质”所 在。

时龙理事长在讲到质量标准框架时,提到了一系列相关 工作,概括地说,主要包括:一制订标准,二研制相应的技 术、方法和工具,三建立监测机制,四建立控制、保障机制。

这四个要素构成了基础教育质量监控的完整架构。

香港教育质量检测和保障的基本机制包含三个圆圈,小 圈指学校层面对于质量的监控,中圈指区域层面对于质量的监控,大圈指国际层面对于质量的监控。它给我们的启示在 于,这三个圈完全符合质量保障和质量管理的一般思维和实 践逻辑,管理学上称之为PDCA质量圈(计划、实施、评价、 改善)。香港的质量监控机制对我们研究、设计、实验基础 教育质量监控的方案和计划,具有重要的参考意义。

基础教育质量监控应该是一个逻辑严密的系统。这个系 统所包括的四个基本环节(质量标准――评价技术――检测 方案――保障制度)的相互关系应该是:质量标准是基础, 是当前的工作重点,是评价或监测的指标构成。监测(评价) 方法和工具是与质量标准相配套的技术手段,是教育评价研 究者最为关注的重点。监测方案是以与质量标准相关联的评 价技术为核心而建立起来的一整套教育质量监测机制,这套 机制也可视为基础教 三、构建教育质量监控体系的四个基本要素及其相互关 系 育质量监测的解决方案,目前国家和各省市正处于尝试 研制和试点建立阶段。第四是依据这套监测机制或监测方案 而构建的质量控制和保障制度,这是通过对现有教育管理制 度进行以保证质量为目标的整合而形成的新的基础教育管 理体系。具备了质量控制和保障机制之后,质量标准才能真 正得到全面落实。

目前来看,要建立基础教育质量监控体系,我们还有许 多问题需要澄清,有观念方面的、习惯方面的、认识和理解方面的,体制、机制和制度方面的,也有技术和操作方面的。

我们首先要解决的问题是制订基础教育质量标准。

这项工作的艰巨性主要表现在三个层面:思想理论层面、 政策制度层面和方法技术层面。

在思想理论层面,“优质”、“均衡”、“人民满意” 等观念混淆在一起,不利于在“什么是”基础教育质量标准 问题上取得价值共识。许多地区在为义务教育均衡发展制订 阶段目标时,都把“优质均衡”或“高质量、高水平均衡” 作为一个阶段目标的标志,说明在义务教育均衡发展问题上 普遍存在认识上的混乱。优质与均衡分别体现着不同的价值 取向。价值的多义性,导致基础教育政策的多标准性;
政策 的不稳定性,导致教育评价及质量监控工作的盲目性和模糊 性。

在政策制度层面,监控体制的建设涉及教育行政部门、 教育督导部门、教育研究部门以及其他相关部门的职责和权 利的整合与合作。近年来,各地教育行政部门在做各种机制 调整的尝试,各级督导部门也在积极开展质量监控的理论和 实践探索。这个层面的问题是当前推进基础教育质量监控工 作的关键。其深层,关乎思想理论的进一步澄清;
其表层, 影响着评价技术操作方面的研究和推进。

在方法技术层面,制订基础教育质量标准,所面临的首 先是质量标准的研制问题,而不仅是测评工具、分析手段等 问题。教育质量监控是以课程标准为基础的,即虽然课程标准是主观制订的,但我们必须假定它是合理、合法的(虽然 有与会者提出课改后新课程标准存在种种问题)。课程标准 可分为三个维度的内容,一是知识、技能维度,二是思维、 表现维度,三是态度、情感维度。知识、技能部分对应的标 准是理解和掌握;
思维、表现部分对应的标准是判断和表达, 态度、情感部分最为复杂,课标对此的表述是态度、情感、 价值观,在实际操作中,如北京的综合素质评价,还包括学 习兴趣、自信心、意志力、积极性等。态度、情感、价值观 的可测标准怎样确定?这是多年来一直困扰大家的难点问 题,但并非不能解决。当我们首先确定质量标准是“准则参 照”而不是“常模参照”,对应的方法是绝对评价而不是相 对评价时,这个问题就会在相当程度上变得比较清晰也比较 容易操作。

质量监控,核心是保障教育活动完成既定目标。香港在 质量标准的基本分类中,同样包含“学生表现”和“校风及 学生支援”的范畴。该范畴的“范围”表述(学生支援、学 校伙伴,态度和行为、参与和成就)和“指标”表述(学生 成长支援、学校气氛,家校合作、对外联系;
情意发展和态 度、群性发展,学业表现、学业以外表现),这两个层次的 表述方式,形成了一种“准则参照”体系,并在相当程度上 具备了“是否”、“有无”的基本特征。由此可见,即使是 对于态度、情感、价值观这方面的教育目标,只要排除了量 的无限要求,其质的部分,还是可以通过我们的细致工作,加工成为可测的指标体系的。上海教科院基教所陆关于上海 地区参加2009年PISA测试情况的报告,也向我们展示了PISA 怎样成功地测查了态度、情感和价值观方面的内容。

四、基础教育质量监控理论与实践今后可能的发展方向 作为基础教育质量监控的核心问题的评价体系及其方 法,可能需要我们向着逻辑化、技术化和艺术化方向进一步 深化研究。评价体系及其方法的逻辑化,指的是强化质量监 控体系的科学化程度;
技术化,指的是强化质量监控体系的 实用化和便利化程度(如指数化、色标化、概念化等);
艺 术化,指的是强化质量监控体系的平等、尊重、友好、善意、 和蔼、亲切等美感友善的程度。艺术化主要在微观层面的应 用中需要特别加以注意,以便于学校和教师愿意自觉地、愉 快地应用。

评价方法和技术没有好坏之分,只有恰当与否。根据不 同的评价目的,选取恰当的、适用的评价方法,是正确的做 法。如相对评价对于发现学校或学生的发展问题而言,是好 的评价方法。绝对评价对于监控既定教育质量目标的完成及 工作改进情况而言,是好的评价方法。

我们始终面临着一个十分纠结的问题:如果说质量标准 的制订从理论上讲指的是“最低标准”的话,那么,我们多 年来习以为常的一些概念,诸如优质、卓越、高水平、拔尖 创新、学生的可持续发展等等,又怎么理解、怎么对待、怎 么处理?换言之,怎么不断鼓励学校办出特色,不断鼓励教师提升教学水平,不断鼓励学生提高学习成绩?这个纠结, 根本原因在于,监控者(政府)确定的质量标准不是质的标 准,而是量的标准;
使用的评价方法,不是旨在达标、在发 现问题以改进工作的绝对评价,而是旨在区分发展差异、旨 在评比排名的相对评价。

其原因还在于,应该属于学校校长甚至教师的某些权力, 在一定程度上还被掌控在政府教育管理部门,质量监控与业 绩考评与评比竞赛等混杂在一起。这些,都有待于教育体制、 制度和机制的进一步改革。教育质量监控工作一方面是一项 有助于促进教育改革的工作,一方面它又需要通过教育改革 的深化才能逐渐完善起来。

通过对现有教育管理制度进行以保证质量为目标的整 合而形成的新的基础教育管理体系,其有效的运行,将全面 促进基础教育质量在“量”的方面的不断提升。优质、卓越、 拔尖创新、高水平、高层次等概念,只有在这个质量监控体 系的基础上,才具有实质的意义。

教育事业是关于人的发展的事业。人的发展是世界上少 数无目标、无标准的事物,因为人们对人的发展的期望总是 无限的,总是“没有最好,只有更好”。人的发展无客观标 准,对人的发展承担主要责任的教育,从理论上讲也就无客 观标准。对无客观标准的事物进行评估的最恰当的方法就是 考察其是否“尽力”了。因此,教育质量在保障了作为主观 标准的质的基础上,继续追求无上限标准的量,在本质上追求的都是“尽力”的程度。教育质量是师生“尽力”的结果, 这个结果属于“明白其存在,但探不到边际”的东西。没有 一种测量方式可以测得出真实的人的发展质量。

也就是说,以课程标准为核心的教育的质是可测并可控 的,而质之上的量由于其无限性,所以含有无标准、不可测 的因素。但经验告诉我们,对一些特殊事物、在特定情况下, 通过测查过程,可以获得对结果的认识;
通过测查教师的工 作,可以获得对学生发展的认识。比如:可通过测查教师和 学生是否“尽力”了,并可用某种方式“不断”和“永远” 地激励这种“尽力”,以使基础教育为学生的全面发展、健 康发展“不断”做出“更大”的贡献。