美国田纳西州实施FTTT法案背景下的几种新型教师评价模式探究_美国田纳西州

美国田纳西州实施FTTT法案背景下的几种新型教师评价模式探究

美国田纳西州实施FTTT法案背景下的几种新型教师评价模 式探究 一、田纳西州关注和研究教师评价模式的背景 美冈大量的实订E研究表明,刁;
同教师的教学能力与 效果存在较大个体差异,与学校环境中的其他影响因素相比, 这种差异对学牛学业的影n向最大。( H长久以来,美圈中小 学教师评价领域却存在“未能区分个体教学水平高低”和“无 法准确评价个体教学表现”的现象。比如,2009年,美国新 教师项目组(tHeNew Tcachcr Program)调查了阿肯色等4个 州内 12个学区的教师评价信息,这些学区皆按各自的正式 评价程序对共约15000余名教师进行」’频次不等的教学评 价:调查发现,很多学区仅粗略使用“令人满意或不满”的 二元评价法,结果是只有刁;
到1%的教师“令人彳;
满”, 其余皆“令人满意”,不存在个体间的差异、优势或不足。

[1]美国教师联合会( AmerlcdnFederat,ion of Teacher.s) 主席兰迪(RandiWcingartcn)认为这种教师评价模式是“敷 衍马虎和白相矛盾的”,美国教育部长阿恩,邓肯 ( ArneDuncan)也对此讽刺地说“我们99%的教州j水平都在 中等以上”。[2] 上述情况引人深思。如果对现柯的教师评价体系进行改 革和完善,必然有助于提高教师教学质量和学生学业成绩。

此时,恰逢联邦政府教育部于2009年发起了投资43.5亿美元 的“争创一流”(Rece to the Top,简称KTTP)计划,鼓励各州积极申请拨款以开展促进学生成绩提高的各项教育 改革。于是,美国很多州都选择通过研究和改革既有的教师 评价模式来提升学生成绩并竞争RTTP拨款。在此背景下,田 纳两州];
2010年1月通过了“首创一流法案”(Irirst to t.he TopAct,简称FTTT),计划改革本州的若干项教育政策。教 师评价模式是其中最具争议和最重要的-项议题,它要求对 所有中小学教师进行年度评价,且根据教师评分结果来安排 津贴发放与人习;
变动等重要事宜,计分规则如卜:按照增 值评估法(Vcrlue Added /Yssessment)汁算学生成绩增长的 结果,此项占比35%;以其他考试方式如毕业率等所反映的学 生成绩占比15%;另外的50%来自于对教师进行课堂教学观察 和个人交流等质性评价的结果。[3]田纳西由此成为美同首 批获得RTTP拨款的两个州之一,拿到了5. 01亿美元的政府 资助。

上述计分规则对教师进行观课等质性评价的分值占比 较高,而由于并非每位教师都任教于需要考试的科闩,唯有 教学观察类的评价方法适用于每位教师。针对于此,田纳西 州内不同学区或学校先后启动了下列五种新的教师评价模 式:教师质量改进模式(Teachcr AdvancementProgram,简 称TAP)、州教育者提升模式(Tennessee Educator Acceleration Model,简称TEAM)、教师教学效益与成果增 长模式(TeacherInst,ructional Growth for Ef´fectiveness andResult,简称T-GER)、教师训练模式(ProjectCOACII,简称COACH)、教师效益估量模式 (TeacherEf´f´octiveness Measure,简称TEM)。

这些模式主要用于观察和评价教师的课堂教学情况,从而统 汁占比500;0的年度教师评分。随后,田纳西州教师研究、 评价与发展共同体( TennesseeConsortium on Research, Evaluation andDcvclopment,简称TNCRED)成立,TNCRED 设计了一个有关上述教师评价模式使用效果的田野调查方 案,以/解2010-2015学年间川内启动和实施这几种评价模 式的效果,借此促进教师专业发展和提高学生成绩。下文从 这几种教师评价模式的基本设计与实施要求、实施效果、现 实应用情况及带给我们的启示等角度进行探究。

二、几种教师评价模式的基本设计勻实施要求 (一)教师质量改进模式( TAP) TAP是基于“丹尼尔森(Charlotte Danielson)课堂教学 评价标准”(2013年版的丹尼尔森标准共包括4大领域22个 指标,4大领域分别为教师对教学活动的设计和准备、课堂 教学环境的营造和布置、教学过程的安排、教师的专业责任 感,前三者都可以通过课堂观察而获取评价信息。)‘ll的 一种教师教学质量评价模式,其实施程序则是由美国教学优 异学会(National Institute forExcellence in Teaching) 设汁的。田纳西州很多学区从2010-2011学年起选用TAP模式 进行教师评价,其基本的实施要求如下:[5] 评价者每学年都要按照TAP模式观察相关学区内所有教师的课觉教学情况。其中,对新教师的观课时长和频率分别 为90分钟以上、不少于6次,对己获终身教职者则是60分钟 以上、不少于4次:要求一半的观课活动持续15分钟,另一 半须持续一整节课:观课包括提前告知和不提前告知两种, 对新教师进行3次观课要提前告知2次,对老教师进行2次观 课则须提前告知1次:在提前告知且持续整节的观课活动前, 教师和评价者双方须就教学内容和学生水平等背景信息进 行正式沟通;
但无论评价者是否提前告知,都要与教师进行 观课后交流,旨在明确教师的教学优、缺点,给出评价结果 并提供评价依据及改进方案、指导教师进行教学反思和改进 等。TAP模式对教师的评价计分采用5级评分制,最高分是5 分。

(二)州教育者提升模式( TEAM) 2010年春,田纳西州教育厅( TcnnesseeDepartment of Education,简称TDOE)及州评价咨询委员会(Tennessee Evaluation AdvisoryCommittee,简称TEAC)组织教师、校 长、学区专家及领导等相关人士研究和借鉴全国及全州范围 内的多种教师评价体系,在模仿TAP模式的基础上开发了 TEAM模式。…TFAVI是一种能够对包括教师在内的所有学校 工作人员进行评价的综合模式。因此,从2011-2012学年开 始实施后马上成为州内使用范围最广的模式,至2014-2015 学年己波及全州约80%的学区。[7] 由于是在模仿TAP的基础上发展而来,TEAM的理论基础也源白“丹尼尔森课堂教学评价标准”,观察视角主要包括 教师的教学准备与规划、教学过程组织和教学环境安排三个 方面,观察步骤也大致与TAP相仿。[8] 首先,在学年之初,评价者要与教师进行一次有目的的 交流,根据教师的日常教学水平或上年度的评价得分等情况, 明确本学期对教师观课的次数、为提高学生成绩而提供的各 种支持以及教师的专业需求等。一般来说,对在上学年评价 得分中等及以下的教师而言,每学年至少要观课4次:但对 上年度评分较高的教师则仅观课1次并进行2次课堂随访。接 下来,评价者进行正式的课堂观察,评价者可以自行决定观 课的重点、时长等。观察重点基本涵盖教师在课程规划、教 学组织和环境布设等方面的表现;
观察时长分为持续15分钟 左右的短时观察或整节课的长时观察:观课也分提前告知或 不提前告知两种,对上学年评价得分中等及以下的教师,至 少一半的观课要在不提前告知的情况下完成,但对上年度评 分较高者则仅选不提前告知的方式:观课结束后,评价者要 在一定时期内给教师提供反馈:最后,综合教师整个学年的 表现,评价者按下列5级评分制给出总结性评分:“远超期 望水准、超出期望水准、达到期望水准、低于期望水准和远 未达到期望水准”。

(三)教师教学效益与成果增长模式(TIGER) TIGER模式的主要评价内容和指标也基于“丹尼尔森课 堂教学评价标准”,但由田纳西州的独立与城市学区协会(Associa.tion of´Tndependcnt and Municipal Schools)开发并没计其实施程序,从2010-2011学年起在该 协会管辖的34个学区内试用。

TIGER依据教学经验与效益情况将教师列入三种发展阶 段:卜1所有未获终身教职者皆为“阶段一教师”(Stage l TeachcJ-s),所有获得终身教职者皆为“阶段二教师”(Stage 2 TeacheI-s),“阶段‘教师”(St.age 3TCachers)是获得 终身教职、且承担对“阶段‘教师”进行观课和指导的教师。

第一学年不存在“阶段三教师”,但从第二学年开始,每位 教师依据其评分可能会继续保持或升降一个“阶段”。

“阶段一教师”被观察的时间最多、频率最高,在一学 年内要完成以下三个环节:第一,校长观察环节。校长会提 前告知教师观课时间并组织课前会谈、填写课前会谈纪要或 交流表:此后校长要进行一次完整的观课,教师需填写课后 反思农并搜集相关材料以备课后交流:接卜来校长和教师就 教学的优缺点等问题进行课后交流,校长向教师提供一份书 面形式的“基准提高计划”(13asc-line Growth Plan).提 出改进要求。第二,“阶段三教师”观察环节。在此期间, “阶段三教师”要根据“阶段-教师”与校长在上一环节形 成的“基准提高汁划”,指导其制定具体的行动计划,并进 行4次不定期、时长10分钟左右的观课,确保其专业进步。

最后是校长考评环节。此环节发牛在第二学期,校长将对“阶 段一教师”进行,次不提前告知的教学观察,并使用之前的材料与其进行课后交流,据其整个学年的表现采用4点量表 给出一个总评分。

“阶段二教师”的观察模式如下:首先,教师向校长i:
交自己的“基准白评及改进计划”,并根据校长即将给出的 书面反馈对之进行完善,随后双方进行约谈并明确一个不提 前告知且不少于60分钟的、人概的课堂观察计划:接下来, 校长按汁划实施观察,教师则需在随后的学年内向校长提供 一系列自己的专业成长活动日志等材料。校长根据个人观察 和各相关材料,给“阶段二教师”一个总评分。

“阶段三教师”的评价主要与其对“阶段一教师”的指 导效果相关。

TIGER模式要求评价者向教师提供书面形式的“基准增 长计划”和“行动汁划”,重视评价反馈以促进教师的专业 提升。

(四)教师训练模式( COACH) 田纳西州汉密尔顿县教育局( HamilLonCountv Department of Education, 简 称HCDE)开发的COACH模式以吉姆·马歇尔(」 imMarshall)的评价理论为基础,其主要理念是以历时较短 且不提前告知的“微型课堂观察”来代替“整节课的观察”。

HCI)L Lk较认jJ」.这种评价理念,因此从2010年起开始在 其所辖的78所学校内实施COACH模式,希望教师能借此展示 日常真实的教学水平,同时IiCDF也可以不干扰教师教学秩序而获得评价数据,达到FTTT法案在教师评价方面的要求。

COACH的实施要求如下:[10] 在一学年内,所有教师都要接受不少于10次、每次不短 于5分钟、不提前告知的微型观课:此外,至少有4次要针对 教师在家长会、团队活动规划等课堂教学环境外的表现进行 评价:在每次观察活动后的48小时之内,评价者要给教师历 时3 5分钟的u头反馈,反馈信息要具体、中立且具备操作性。

HCDL提供网络端口可供评价者和教师上传评价信息并进一 步讨论交流。COACH模式使用4分量表,对教师在6个教学领 域、共60个评价指标方面进行评价:该模式不要求每次观察 都能给出教师在每个指标方面的表现,只要在整个学年内给 出每个评价指标的评分即可。学年末,评价者综合所有观察 数据,给教师一个总结性评分,并生成一份教师专业成长计 划,明确教师的优缺点,评价者和教师双方可就其展开研讨 改进计划。

(五)教师效益估量模式(TEM) 201 1年6月,田纳西州曼菲斯城市学区(Vlemphis City Schools)启动实施」’TEⅥ模式,TEM由曼菲斯市的学区领 导、教育专家、优秀教师1了比尔和梅琳达·盖茨基金会(Bill &MelindaGates r;oundaLion)合作开发,其坚持的理念是:
“正如教师是判断学生学习效果的最佳人选一样,教师同行 是判断某位教师教学效益高低的最佳人选”。

…因此,在 进行教师教学效益评估和促进教师质量提高方面,重视教师同行的参与和作用发挥。

TFM模式在估量和提高教师教学效益方面遵循以下四个 策略,并按之制定了…个两年任务完成计划::“ 1.以学生成绩增值的幅度、对教师进行观课的效果和 综合的评估结果、利益相关者的认可度作为估量教师效益的 依据,前两者在教师评分中各占比35%,后两者各占比15%。

这方面,第一年的任务主要是完成评价者培训和搜集数据等 相关工作:第二年即开展具体的评价工作和促进有效教学。

2.通过做好教师招聘工作和提高终身教职门槛、提高 高效教师的留任率及调整低效教师的流失率等措施建设师 资队伍。第一年主要是形成由教师、校长等人员组成的终身 教职评价小组和安置学校内空缺的教师职位:第二年主要开 展实际工作,如促成极端低效教师的流动或离任等。

3.通过提高专业支持与个人需求的一致性、基于绩效 而分化不同教师的职业发展路径、提供差异化津贴补助等措 施来支持教师队伍。第一年主要开展相关调研;
第二年主要 是做好专业支持与教师需求的对接、清除高效教师职业发展 的障碍等。

4.创设各种有利条件以形成高效教学的氛同。第一年 的计划是提高校长领导力和为教师提供专业改进的活动与 机会等;
第二年要创造条件,构建有利于高效教学的文化环 境。

三、实施效果本部分内容主要基于TI\CRED对2011-2014三个学年间 学生成绩的分析、通过电子邮件等对被评价教师进行的问卷 调查、对相关学区或学校进行的访谈等数据,了解上述几种 教师评价模式的实施效果。…l主要是从评价模式的信度、 评价反馈情况、评价者资格及其准备程度、评价带给教师的 负担、评价者和教师双方的总体感受等角度,展示和分析 TEAM、TIGER、COACH、TEM这四种模式的整体实施效果(由 于TEAM“脱胎于”TAP且使用范围更广,所以仅讨论前者):
另因调查对象皆源自在TDOE登记在册的学牛或教师信息系 统、所使用调查问卷和评价量表的有效性及所选择调查样本 的代表性情况等已经过分析,所以将略去这些信息。

(一)评价模式的信度 首先考察各学区或学校是否按不同模式的要求进行了 足够次数的观察。2012年,接受TEAM模式的多数教师经历了 1-3次短时和长时观察,接受COACH模式的多数教师经历了近 10次微型课堂观察,这符合各自的要求:TIGER和TEM两种模 式的统计结果却与其要求差异较大。但综合2012-2014各年 度的数据可知,几种模式对教师的观察次数以考虑教师的工 作经验和前-年度的得分情况为前提,工作经验不满3年或得 分较低者接受观课次数较多,每种模式对教师的观察次数基 本符合相应的要求。其次考察的是教师接受的课堂观察是否 符合相应的时长要求。大部分教师每次接受短时观察达 15-20分钟、长时观察达45分钟以上,也与相应要求吻合。(二)评价反馈情况 1.反馈环节所花费的时间及反馈速度。2012年的调查 结果是:COACH模式只对教师进行短时观察,课后交流用时 约为5-20分钟;
TEAM、TIGER和TIiM模式方面,90%左右的短 时观察后的课后交流用时也是5 20分钟左右,大部分长时观 察后的课后交流在15-45分钟左右。2013和2014年的数据显 示:评价得分越低的教师越倾向于在课后交流环节用时更久 和提供更多跟踪指导,得分越高者则相反;
但教师普遍反映 四种模式提供的跟踪指导次数都偏少。另外,四种模式中, 90%左右的教师都在观察活动发生10天左右后收到了口头或 书面的反馈,反馈或建议一般以评价量表为基础。

2.反馈涉及的主题及所发挥的作用。首先,教师接收 到的反馈内容绝大部分都与组织和呈现教学内容、提问和促 进学生投入学刊、管理学生行为、构建教学环境等相关,评 价者认为这些是提高教学质量的关键。其次,反馈所发挥的 作用主要是看评价旨在提高教师教学质量还是对教师进行 绩效评判。2012 2014的三个年度内,受访教师认为评价者 更关注其教学质量提高的比例分别为37%、47%、50%,持同 样观点的受访评价者的比例分别为68%、76%、79%。这说明:
评价者和教师双方关注教师教学质量提高甚于绩效评判的 比例都在稳定提高:双方的数据差除了说明评价者和教师的 感受不一致外,还说明前者的主观意愿并非对教师进行绩效 评判。3.反馈对教师专业成长的促进情况。2012年的调查结 果是消极的,很多教师认为评价无助于个人的专业成长;

2013年,教师强调“一对一的教学指导或跟踪指导”对白己 帮助较大:2014年,教师具体指出,被同一评价者(校长或 教学专家等)观课的频次越高则帮助越人,如相比那些被同 一名校长听过3次以上课的教师,只接受过一次校长观课的 群体中仅有7%或更少比例的教师认可反馈的作用,其原因或 可归于评价者和教师之间反馈与交流的持续性。可见,评价 反馈促进教师专业成长的作川逐年凸显。

(三)评价者资格及其准备程度 评价者、TNCRED成员等相关人士对教师进行观课和给出 评分之前,要接受专业培训和认证以收得评价资格,包括了 解各种评价模式的来龙去脉、借助教学录像使用不同评价模 式和进行真实的观课预练等。TNCRED从以卜两方面了解评价 者资格及其准备程度的问题:
1.评价背接受专业培训的时长发在应对评价任务时的 准备程度。2012年,900/o以上的校长、副校长和教学专家 接受了10-20小时以上的专业培训,但大部分允当评价者的 教师接受培训的时长都少于10小时:90%以卜的评价者都认 为自己在记录观课过程、进行课前交流和课后反馈、掌握各 指标的评分原则和给与适当评分等环节做好了充分或一定 程度的准备。由于评价者被要求持续接受专业培训和资格认 证,因此,2013年、2014年的调查结果与之大致相当。2.评价者在学校体系中担任的职位或角色。调查表明, 与教学指导教师、学科带头人和校外专家等相比,大部分的 观课活动都是由校长、副校长或校长助理完成的。比如,2012 年,受访群体中自称充任观察者的“校长、副校长”占群体 比例接近60%:2013年、2014年,TNCRED的考察也表明,校 长、副校长在教师评价中的参与程度最高。

(四)评价带给教师的负担情况 ITTTT法案要求州内每位教师都要接受年度评价,这必 然增加评价者和教师双方的工作负担,TNCRLD主要通过调查 下列两个问题来了解这方而的情况:
1.评价者和教师花在评课或准备被评方面的时间。综 观各种模式中的教师群体,2012年,约1/2-2/3的教师花费2 小时以卜准备—节预先被告知的听课:2013年有470j0的教 师、2014年有44%的教师为准备被听课所花费的时间超过丫3 个小时以上。评价者为评课化费的时间-般要少于教师的准 备时间,但2013年的调查表明,多数评价者每周用于评价相 关的下作时长达4-9个小时,他们花在与教师交流、分析学 生成绩等相关活动方面的时问超过了2012年;
2014年显示出 同样的倾向。可见,评价者和教师为评价所花费的时间在逐 年增多。

2.评价者对评价工作所带来负担的认识。2012年, COACII模式中只有IO%的评价者认为负担较重,而TEAM、 TIGIER和TEM:三种模式中认为充当评价者负扒较重的比例却达50%左右。但之后的两年,评价者对此的感受却转向积 极正面,下文将谈及此点。

(五)评价者和教师双方对评价模式促进教师专业进步 的总体感受 总的来说,评价肯和教师双方对评价模式的满意度是逐 年提高的,如下所述:
1.双方对评价活动所带来的专业收益的感受在加强。

2012年,在调查评价者和教师双方“认为TLAM模式及其所使 用的评价量表、所开展的评价活动等能否促进教师改进教学 质量”等问题时,评价者的认可度普遍较高,但持肯定态度 的教师比例仪50%左右。2013年、2014年的调查则表明,相 比2012年,更多教师认为评价活动在“改进教学质量、提高 学生成绩、选择参与何种专业活动实现专业提升、认清职业 发展前景等方面”给自己带来了较大收益:评价者群体对评 价活动助益教师专业发展的感受则仍高于教师群体. 2.双方对所使用的评价模式的认叮度在逐年提高。

比 如,2012年,教师对“占总评分50%的TEAM、占比35%的增值 评估和占比15%的其他普通评估方式”的认可度由高到低分 别为“增值评估、TLAM、普通评估”:评价者群体的排序则 是“TLAVI、增值评估、普通评估”。但到2013年,更高比 例的教师和评价者表示史认可本校区所使用的评价模式,其 中,表示“满意”的教师比例从290/o增加到50%,表示“满 意”的评价者比例从63%增加到78%。2014年,持认可态度的教师和评价者比例略有回落,但仍远高于2012年。

3.双方对评价模式价值的满意率在逐年增加。2012年, 虽有2/3的评价者对TEAM的效果表示满意,但约3/4的教师不 满意,而且,教师和评价者都认为评价活动带来了较大的压 力,白认住这方而付出大于收获。但到2013年,持“付出大 于收获”看法的教师和评价者比例减少了约10%,认为“评 价引发较大压力和干扰教学秩序”的教师比例降低了约8%;
2014年的调查数据与此接近。

四、现实应用 调查教师评价模式实施效果的主旨在于,根据调查结果 及获得的评价反馈信息而改进教师的教学实践。TNCRED连续 3年调查而证实的下列几点大致可供改进现实之用。[14] (一)教师取得改进效果最明显的领域 主要集中在与教学计划、准备和实施相关的环节。以 TEAM为例,教师选择的l0个改进效果最佳的指标中的前8个 都属于教学领域,分别是:课堂提问技巧、教学目标制定、 教学内容结构的组织与安排、教学活动或材料的组织、激发 学生的参与热情、呈现教学内容、学生分组和教学相关的问 题解决。其中,课堂提问技巧等前4项也被教师认为是从评 价活动中获得了最大提高的指标,此后才是与“教学环境创 设、教师专业素养提高”等相关的一些指标。

(二)评价反馈是改进教师教学实践的熏要影响因素 教学方面的问题是评价反馈最集中的领域,而评价者反馈在很大程度上决定了教师的工作重心。比如,当教师被问 及自己努力并最终实现某个评价指标方面的进步的影响因 素时,2/3的教师回答是由于“评价者指出了自己需要改进 的领域并提供反馈建议”:
2013年,调查白认为未能从评 价活动中获得任何进步这—*教师群体时,他们陈述的理由 中,除了“认为自己各方面已达标和没时间”之外,另一主 要原因即“反馈不明确和不知道该采取何种行动”。

(三)帮助教师实现专业提高效果的排列次序 一是自己在“教学实施与设计”方面的行动,主要包括 尝试新的教学活动组织方式、设计与规划教学内容;
二是自 主的学习或阅读活动;
三是与同行的非正式交流;
之后是与 指导教师或评价者的“…对一”交流、参与学区和学校提供 的专业研习、观摩课等活动。前三者是教师认可的最常采取 且最有效的专业提高行动,“…对一”交流等虽然也对教师 的专业改进帮助很大,但或是由于其发生频率不高而影响了 其效果。

(四)教师最难实现改进的领域 主要包括课堂提问技巧、教学过程中的问题解决、学生 学习动机的激发和思维能力启发、学生分组、教学内容结构 的组织与安排等方面:导致难于改进的原因主要包括教师缺 乏高质量的培训或专业学习机会、缺乏时间、学区和学校的 专业支持不够,以及学生、学生家长和教师个人的学习或改 进动机不足等。对照着本部分第一点来看,似乎取得改进效果最佳的领域和最难实现改进的领域多有重合之处,成功机 会与困难并存。

(五)评价结果 大部分教师和评价者都一致认为,评价结果应该用于促 进教师的专业改进、自我提高、留任和获取终身教职等方面, 教师不希望将之直接与津贴发放相挂钩。

综观田纳西州在FTTT法案背景下探索的新型教师评价 模式实施情况,我们大致可以从以下几个角度考虑提高我国 的教师评价质量和教师教学实践质量:一是在教师评价过程 中要注意落实“ -对一”的指导与交流环节,提高对教师跟 踪指导的次数:二是处理好评价旨在促进教师专业进步和对 教师进行绩效评判之间的矛盾:三是帮助教师平衡在“被观 察状态下”和自然状态下的授课心态,协调评价工作带给教 师和评价者双方的工作负担问题;
四是对评价者进行专业培 训和资格认证,专业培训要有一定的时长保证和试评练习, 资格认证要定期更新。

[1] Daniel Weisberg, et al.. The Widget Ef´f´ect: Our National Failure to Acknowledge and Act