基础教育学业测评体系评析
基础教育学业测评体系评析 一、追求平等:学业标准化测评的理想设计 问责制度的第一个步骤就是要能全面采集问责的信息, 即通过标准化的测评方式采集学生学业成就信息。为保障学 生学业问责制度的科学有效,美国建立了统一测评标准、多 元测评方式的学业测评体系,期望从测评主体、测评过程以 及测评方式上保障学生得到全面、规范和多元的学业评价。(一)坚持立体统一的学业标准体系 一直以来,各州在教育的教学、课程、评价等方面可自 主设定标准,这造成了各州教育质量差距难以统一或协调。
20世纪80年代,美国开始了统一和提升教育学术质量的标准 化运动。一系列教育标准的文本和法案陆续出台,如《数学 课程与评价标准》、《2000年目标:美国教育法》、《面向 学生的美国技术教育标准》等,基础教育阶段的各学科确立 了全国标准框架。这些国家标准并非强制性的,各州会在参 考国家标准框架基础上自行根据本州教育情况设定具体的、 可操作的教学标准及评估标准,确保课程标准与评估标准的 一致,从而地方学校系统能有统一的课程目标、知识难度和 学业评估标尺。然而,各州教育资源配置不均衡的现实决定 了各州立教育标准在内容、重点、特色方面必然出现难以弥 合的差异。为逃避NCLB法案中各州学校因学业成就不达标而 遭受严惩,各州政府开始应对性的下调州立学业标准。对此, 奥巴马政府提出了“力争上游”计划,期望通过政府拨款鼓励各州共同开发全国性统一学业标准,改变教育问责标准不 一而失去权威性和实效性的不良局面。2010年全美州长协会 与州教育长官委员会共同颁布“共同核心州立标准”,以此 对美国学生的“升学与就业准备”能力实施教育问责。[2] 该标准设立了学生毕业时应达到的公民基本能力目标,而问 责测评应是确保评估标准与课程标准保持一致的一种合格 评估。作为升学和就业做准备的底线评估,该标准明确界定 了学生在基础教育阶段必须掌握的基本知识和技能,进一步 明晰了美国基础教育发展战略:不是追求阶段性的“质量” 数据提升,而是为后十年的个人与国家整体水平提升做好准 备。基于此,该标准的设定不再局限于过去评估标准与课程 标准的水平一致性,同时关注了包括知识内容、知识样本分 布、知识广度以及知识深度等各方面与高校学术课程衔接和 发展的垂直一致性,从而确保所有进入大学课堂的学生都在 基础教育阶段为成功做好准备。
(二)专注多元全面的学业测评体系 为了能保证每一个孩子受到同等的教育对待,从教育机 会均等走向教育对待平等乃至实现教育结果公平,标准化测 评在NCLB的法案保障下成为美国政府检测各学区、学校学生 教育质量的有效工具。一方面,美国绝大部分州都设立了全 州统一的评估考试体系,从纵向覆盖了从幼儿园到高中整个 基础教育阶段不同层次,从横向则涵盖了不同学科和不同类 别学生,并由州教育部将每一阶段教育测评结果书面通知到每位学生家长。[3]同时,为了体现教育公平中“同等对 待相同的人”的水平公平,“不同对待不同的人”的垂直公 平,以及通过教育阻止社会代际不平等延续的代际公平原则 [4],测评体系针对不同家庭背景、不同发展阶段学生提 供了不同标准的测评标准、途径和机会。如马里兰州在学前 教育阶段实施诊断性测评以提供儿童发展信息;
对普通高中 学生实施统一标准的高中评估毕业考试;
对被鉴定为严重认 知障碍或其他符合政策的学业薄弱学生提供特殊标准的替 代考试,并将全州统一的学校评估考试作为地方教育政策、 财政配置的重要参考依据。另一方面,教育公平追求还体现 在体系测评过程的公正,即公正的测评环节和多样的测评方 式。美国基础教育问责测评通常包括三个环节,即命题、测 评与数据转换。命题方面,许多州会委托专业机构根据州课 程标准建立试题库,并研发低重复率且涵盖核心内容的抽样 技术。测评与数据转换环节则主要通过笔试和表现性评价测 试搜集并转换为学生学业评估数据。笔试虽然在NCLB实施后 放大了“应试教育”的教育问题,但其因为评价公正、信效 度较高、成本较低等优点,仍然是问责测评的主要途径。而 表现性评价作为笔试测评的辅助,可较好地对学生事实性知 识以外的能力进行评价,如批评能力、学术思维能力、问题 分析能力、以及情感素质和行动力等。为此,美国一方面加 大对评估测评模型的改良研究,即如何将最初的单一的终结 性评估改为诊断性、形成性以及总结性合为一体的复合型评估模型;
另一方面则不断尝试提升表现性测评的公正性、有 效性、多样性以及规模性。许多州已将表现性评估纳入到问 责评估系统,并结合笔试测评数据形成最终报告数据的评估 指标。[5] 二、加剧不公:学业标准化测评的现实结局 美国学业标准化测评体系虽然期望通过统一的学术标 准、公正的考试程序、科学的数据分析等合法的实施设计来 有效促进各州、学区和学校的教育质量平等的问责,但实践 效果却是与促进教育平等的目标背道而驰。
(一)学业标准化测评的不平等后果 美国一直以来对于不同种族、阶层实施的是“熔炉式” 的多元文化教育,强调教育内容与方法的个体差异,但标准 化考试问责制度要求不同文化背景的学生以统一的核心课 程考试决定人生的成败,且该制度的考试设计者都是来自于 社会上层阶级的“学科精英”,他们从社会主流文化角度设 计的考试,忽视了学生在种族、文化、经济、资源、认知等 各个方面的背景差异。这种以中上阶层学生情况为基础而确 立的教学内容、方法和评价标准,导致了少数族裔、低收入 家庭等不利地位学生符合考试标准的比例明显低于白人学 生。同时,为公平而将学生成绩按种族或背景进行归类,相 反给这些学生打上了“差生”的标签,并将其推向辍学的边 缘。以学生分数对学校、教师进行分级和奖惩,使许多学校 为了避免被鉴定为“落后”,不得不舍弃成绩落后的学生来换取形式上的进步。学校整体分数的提升、白人与少数族裔 学生“学业鸿沟”的缩小,这些形式上、表面上看到的公平, 背后是大量少数族裔学生的辍学换来的。[6]以“选拔” 为导向的统一标准化考试给学生们带来的不是期望的公平, 而是弱势群体被无情的淘汰。[7] (二)教育不平等现状的原因分析 标准化测评问责制度追求教育公平的理想设计在法律 上实现了学生形式的平等,却造成了事实的不平等,这在实 践中主要体现在教育资源配置不平等、教育过程文化不平等、 受教育对象经济不平等这几方面。首先,教育资源配置方面, 标准化的学业测评体系虽然提供了公正的测评过程和精密 的评估模型,其最终只是测评了考生对某项技能或知识的掌 握情况,却并未考虑不同学生是否拥有均等的机会去接受同 等的教育对待。由于贫富学区教育经费的巨大差距而导致包 括师资水平和硬件资源等教育资源配置不均等是贫富学区 学生无法获得相同测评结果的根本原因。而以“惩罚落后、 奖励进步”为基调的标准化测评问责在缺乏对贫困学区资源 配置充分倾斜的实践中,反而恶化了落后学区的教育处境。
由于贫富学区在不同教育资源配置下被设立了同样“平等” 的测评标准,导致许多落后学区不得不“为考而教”,产生 “应试教育”相关各类问题。其次,在教育文化方面,尽管 美国政府一直奉行多元文化政策,试图通过文化的平等、理 解与共融取代过去“文化熔炉”的形象,各学区、学校、教师都会尽量根据不同文化背景学生的认知特点去设计教学 和建构对话。多项研究表明,只有在教学中保持对学生(尤 其是少数族裔学生)的习俗、语言等文化要素足够的敏感性 和包容性,才能诊断其学习需要并发挥其学习潜能,这才是 实质且充分的教育公平。[8]然而,标准化测评问责制度 的实施使教学过程中的关注学生需求个性转为注重测评课 目共性。最后,在学生经济背景方面,由于测评试题都是以 社会主流的中上层文化作为背景和标准进行编制的,这使得 家庭经济地位高的学生在高利害测评中占居优势地位。相反, 家庭贫困的学生在教育资源配置和测试中都处于不利地位, 往往会被包含了表现性测试的“全面的”、“多方位的”公 平测评考试所淘汰,致使教育变成社会不平等延续的代际工 具。
三、走向均衡:理想与现实博弈的理性思考 教育标准化测评问责制度理论设计与现实结局的相悖 从根本上体现的是美国基础教育改革在国家理念与市场逻 辑的分歧。正如美国政府在新自由主义与新保守主义两大思 潮中的不同公平取向:一是以哈耶克观点为首的坚持程序正 义的机会公平论,即政府应也只应确保市场过程自身的合法 性才是公正的;
另一种则是以罗尔斯观点为代表的社会正义 的结果公平论,即政府应通过补偿弱势群体来弥补因历史或 其他原因造成的社会不平等。[9]为此,对起始状况不平 等的人予以同样的对待和测评,其测评手段和过程越是公正和科学,结果越是加剧社会的不平等。教育测评体系虽然关 注了标准、程序、模式的科学与统一,但这仅仅是推动了程 序正义的机会公平,而薄弱学区、学校、学生却因初始不平 等且未得到充分的教育资源补偿造成了不平等结局。从社会 系统的整体视角对美国基础教育标准化测评进行理性思考 将有助于理解我国高考改革的现状与未来。
(一)社会分层与控制:高利害教育测评体系的社会合 理性观照 教育是一种社会性的存在。教育的问题既是教育系统内 部的问题,更是社会整体的问题。社会分层指代一种被制度 化的社会资源的配置不平等系统,它无论是在发展中国家或 发达国家都普遍客观存在。因此,在教育领域,学生个体间 的差异性是客观且自然存在的,但是由于基于不同评价标准 的评价造成了学生间、学校间、学区间的在进行资源配置时 出现不平等,且这种不平等因为这种评价制度的不断精细化 完善而制度化,最终固化为社会分层。而评价话语权力的归 属与评价标准的设定则体现了国家当前的社会价值取向,即 决定了教育是体现中上层社会阶层利益而对当前社会不平 等结构进行固话,或是体现底层社会阶层意志而促进社会阶 层流动。因此,美国NCLB法案推动下的高利害标准化测评问 责导致“为考而教”、追求“年度进步目标达标率”等现象 出现,是学校、家长、学生在政府设置的“社会流动”这一 游戏规则下做出的必然教育选择。在我国,因高考采取能为社会各阶层提供一个共同获取高等教育机会的测试标准,使 农业人口看到了二元超越的希望,政府尽管一直为解决高考 带来的“应试教育”问题而提出过“取消考试”、“减负” 等政策,但始终成效甚微。从这个角度看,在当前城乡二元 经济结构背景下,我国以笔试为主的高考恰恰因为其各种 “应试漏洞和诟病”使社会分层无法得以完全固化,而为广 大贫困地区人口的跨阶层流动留下可能。
(二)精英主义与顶线评价:基础教育标准化测评体系 的主要批判 无论是美国NCLB法案或是中国高考带来的应试教育后 果虽在优质资源稀缺性等现实客观背景下存在一定的社会 合理性,但不可否认的是,以精英主义教育价值观主导的高 利害考试测评不应该出现在基础教育,尤其是作为国家准公 共产品的义务教育阶段。所谓精英主义教育是指教育活动的 主要甚至唯一目的是培养和选拔精英人才,而这种人才是对 以学科专业人才为主体的所有高级人才的总称。该理念假设 受教育者潜力有“三六九等”之别,现实依据是精英人才主 导社会发展,以学科化、专业化标准对受教育者进行选拔和 培养。[10]这种教育观念下的测评不再指向人的基础发展, 而是精英的培养和选拔,其通常都会采用一种选拔性的顶线 测评而非合格性的底线测评。对于教育测评来说,在国民素 质建构与发展的教育系统中,基础教育是教育系统的第一层 次,而专业教育、职业教育则是第二层次。基础教育测评保持教育的第一层次合格目标,这是它的底线,而追求教育第 二层次的选拔目标,则是它的顶线。前者是以全体学生的、 全面的、基础的公民素质培养的测评,而后者则是关注部分 学生的、非全面的、考试竞争成绩的测评。[11]为此,美 国政府在NCLB中提出的“让所有学生能在2014年之前达到各 州设立的学业成就熟练标准”目标,表面上看是以提升每位 学生的学业成就以及缩小不同族裔学生间学业差距的合格 性测评,其实质却是以精英培养标准对部分“核心”素质和 部分落后学生实施的竞争性测评,企图通过高利害问责促使 每位学生都成为国家设定的“世界精英”,其结局只能是NCLB 实施以来全面约71%学区减少历史、音乐等非测评课程的教 学时间,以及大量填鸭式教学、流水线作业工厂现象的出现。
[12]基础教育的顶线评价会造成越陷越深的教育困境,当 教育越是走向高层次,实施顶线评价的基础教育就会产生越 深的矛盾。一方面,基础教育顶线评价会混淆基础教育与高 等教育的性质与使命的差异,即基础教育作为由政府履行组 织和供给职能的准公共产品,应具有不同于其他层次教育的 公益性,且必须遵循均等机会对差别原则的优先性原则。
[13]否则,基础教育顶线评价会造成精英与平民的阶层对 立,使公共教育成为文化、政治、经济等领域中的资本代际 工具。另一方面,由于“统一且平等”的标准设定中必然附 加了利益阶层诉求和国家政府意志,基础教育顶线评价通常 会极大抑制儿童的自然成长与个性需求,使许多其他标准测评下的“人才”丧失潜在发展的可能性。
(三)走向生存与发展:均衡理念下基础教育测评体系 的发展取向 均衡并不等同于公平或平等,它是一个更为动态和强调 过程的概念。教育均衡强调的是“满足所有人最基本的学习 需要”以及“提供每一个人所应得到的”,而非绝对的平均 和相等。均衡观念下基础教育测评体系的发展应走向生存型 评价和发展型评价。一方面,基础教育测评取向应是大众主 义教育价值观的底线评价。底线评价是一种走向大众化的评 价,它以生存意义绝非选拔意义的基础教育作为价值前提。
生存型的基础教育意味着每个人都应具备良好的适应现代 生活的公民素质,而这些人都在时空宽泛意义上享有同等机 会成长为精英。因此,这种生存型测评目标是指向全体而非 部分学生的发展,强调学生整体素养的形成,淡化学科化、 专业化的训练;
测评程度是普遍可及的和合适的,也就是学 习者在基本的教育资源配置下通过适当努力可以实现的;
测 评性质是一种公民基本品质的合格性评价、基础性评价、发 展性评价。为此,美国从2005年底开始大力推广评估增长模 型,在2014年启用共同核心州立标准的复合型模型都表明了 联邦政府对评估的内在含义:并不是要求所有学生达到一样 的学业水平,而是达到国家规定的较高的基理想与现实的悖 反:美国基础教育学业标准化测评体系评析本标准后,在这 “共同基石”上发展学生的个性和差异,从而提升整体兼顾缩小差距。[14]另一方面,基础教育测评取向应是教育均 衡理念的发展性测评。教育均衡发展不是“削高就低的限制 发展”,更不是让所有地区或学校发展成同一水平和同一模 式,而是在基本平等的办学条件下,比较公平的竞争环境中, 鼓励不同地区或学校追求特色发展,全面提高教育质量。而 “发展”的基本前提则首先是对地区间、学校间、学生间在 教育资源、水平、天赋以及未来的发展方向等方面差异性的 认同与尊重。因此,在设立测评目标的时候,不能只关注教 育的物质性和结果性目标,而忽视了功能性和过程性目标。
即基础教育测评的目标是促进学生的整体能力、素质的全面 提升与发展,这就要求测评指标不能一味强调学科或素质的 全面性而忽视个体学习的可持续性和发展性。这样,基础教 育测评在关注测评标准与课程标准的水平一致性的同时,更 应重视测评标准与高层次教育衔接和发展的垂直一致性,从 而保障每位学生能在基础教育阶段为未来成就做好准备。