各州将在本学年进行标准化考试。但是,最好的报告这些考试成绩的方法是什么呢?这种方法既有用,又能突出那些有最大需求的学生,而且不会从根本上造成误导?
一位评估专家认为他可以提供帮助,他将他的建议分享给了国家公立学校的负责人。在他的方法中,很大一部分是把考试想得不像传统的考试,而更像一次人口普查。另一个重要的方面是拥有过去五年中跟踪个别学生的数据系统。
但哈佛大学教育研究生院(Harvard Graduate School of Education)教授何安德鲁(Andrew Ho)提出的这项计划,并没有针对今年考试中涉及的所有潜在障碍提出简洁的解决方案。当然,这可能无法说服许多怀疑者,他们对测试的担忧超出了他的宣传范围。
美国教育部2月22日宣布,它不接受各州的要求取消标准化考试根据《每个学生成功法案》的规定,在本学年进行教育,尽管一些州正在推动这样做。并非所有州都放弃了希望取消这些测试或以某种方式取代它们。但由于大流行的破坏,许多州仍将如此面对测试的重大挑战.
最大的挑战之一将是如何以一种有意义的方式报告成绩,但不忽视远程学习、大部分或完全从学校消失的学生、考试选择退出以及其他问题。简而言之:在这些分数上投入太多(如果有的话)还存在很多疑问。
考虑到这些问题,何猷君进行了推介三个测试分数指标供各州报告以及如何从标准化考试中获得它们。上个月底,在拜登教育部宣布这一决定后,他向州首席学校官员委员会(Council of Chief State School Officers)提交了他的测试合作计划。
“我们知道问题所在。这些问题是实质性的。它们非常庞大,”何猷君在接受采访时说。“如果没有大量的误解和技术缺陷,就无法像往常一样解读今年的成绩。”
与此同时,何强调,这些问题不应该看起来如此令人生畏,以至于没有人试图“给出技术解决方案,并将这些缺陷最小化”。
公平性、趋势和匹配是关键
何猷君的提议主要有三个要素。
1.第一部分是报告今年参加州考试的学生中有多少人以前的考试成绩相当——事实上,他强调了这一点的重要性,而不是各州在报告考试数据时关注的第一个问题。这意味着查看哪些学生两年前参加了考试,以及他们是否参加了本学年的考试。记住:去年各州取消了他们的考试全部,所以没有那个时候的考试成绩。
例如,各州会报告两年前参加三年级考试,今年又参加五年级考试的学生的百分比。这将需要各州的数据系统来跟踪个别学生。
Ho说,这相当于进行一次教育普查,帮助各州将学生分为两个重要的群体:一个国家有可比的考试成绩数据,另一个没有考试成绩数据。
“它立刻把你的注意力分成两个值得关注的群体,”他说,并把他的这一想法称为“匹配率”。
2.第二部分将重点关注两个学年前有可比性考试成绩数据的学生。
何建议,对于这些学生,各州可以找到他们以前的“学术同龄人”。换句话说,各州将确定2017年和2019年在考试中表现相似的学生。然后他们会研究2017年组在2019年测试中的表现,以及2019年组在2021年测试中的表现。(这就是为什么Ho的计划依赖于那些拥有纵向数据系统和可追溯到2016-17学年的“稳定”测试系统的州。)
这种方法将帮助人们确定大流行对学生学业进步的影响程度,与COVID-19之前的类似学生相比。何猷君称这是一种“公平趋势”。
3.第三部分关注的是今年没有参加考试的学生,以及教育系统已经失去关注的学生,即何教授所说的“公平检查”。
对于这些学生,Ho还建议查看这些学生2019年的成绩,然后查看他们2017年的学术同龄人,然后查看该同龄人2019年的考试成绩。
何猷猷承认,他的计划的第三部分“需要最多的猜测”,但仍然可以讲述一个有意义的、描述性的故事。然而,他也表示,这种“公平检查”可能会描绘出这些失踪学生的最佳情况。为什么?因为它“假设2019年至2021年失踪人员的学术学习率与2017年至2019年相同,”何写道。
对这些测试的担忧将持续下去
何的备忘录中包括了一些技术细节,比如学生在学年之间离校的情况,但并没有直接涉及高中的州考试。各州被要求在高中阶段对某些科目进行一次考试,尽管联邦法律没有规定在这些年级中有一个特定的年级。
在他的备忘录中,何鸿燊建议各州“保持简单”,以免各州“在一个似乎是黑匣子的东西上冒公众信任的风险”。在采访中,他承认,在考虑数据时,“复杂总比错误好。”
何猷生强调,今年的目标不仅要评估学生的需求,还要评估疫情影响最严重的地区:“我们不知道的是,与往年相比,今年谁需要更多的支持。”
那些在秋季考试的州呢?教育部告诉各州,他们可以在典型的考试窗口之外进行2020-21年的考试,比如今年秋季。然而,何说他不认为他的方法适用于这类测试,因为没有过去的秋季测试可以用作适当的基准。此外,他说,各州在未来几个月可能提供的延长学习机会(比如暑期学校),或者相反,任何形式的“夏季滑坡”,都让秋季考试总体上成为一个可疑的命题。
家长选择退出怎么办?大量父母让孩子呆在家里(或以其他方式远离)参加国家考试的前景引发了一系列担忧,即谁将接受测试,以及这些测试的结果可能会被误解和误导。例如,如果许多成绩优秀的学生参加了考试,而他们的同龄人却不参加呢?
何说,他的第一个衡量标准“匹配率”就是为了消除这种扭曲,因为它强调今年是非典型的一年,并清楚地表明在某些情况下,有很大一部分学生没有参加今年的考试。
远程管理的测试呢?何猷君承认,远程管理考试对分数的可比性构成了“严重风险”。但他把比较现场和远程考试成绩是否公平的问题留给了正在进行的或“事后”的研究。他说,无论哪种情况,他提出的指标仍然是有用的。
毫不奇怪,反对今年考试的人有一系列的担忧没有被何猷君的计划所解决。
在一个188竞猜比分宝金博188官方网址科罗拉多大学教育学院的杰出教授洛丽·谢泼德在去年12月发表的一篇评论文章中表示,如果官员们考虑到从家长情绪到后勤问题等所有不利因素,他们就会这么做取消大部分(如果不是全部)状态测试.
在一次采访中,Shepard表示,从统计学家的角度来看,Ho对创造“公平趋势”等问题的关键建议是很好的。但她表示,这并不能保证各州会公平地处理分数。
谢泼德说:“我们都知道,当事情被公开发布时,大多数人通常依赖的是简单的解释。”“会有误解和滥用。(请阅读有关数据报告要求的更多信息在这里)。
她指出,高退出率仍然给何猷君的方法带来了问题,尽管他的方法试图解释这些问题。
谢泼德还强调,大流行前关于其他事情的数据,比如联网设备的访问,可以比考试成绩更有效地引导资源。
理想情况下,考试成绩将“发挥第三个作用,”何说。对学生身心健康的衡量,以及地方评估,也应该成为国家领导人的重要考虑因素。
尽管如此,Ho强调,“用糟糕的数据在屋顶上尖叫”对测试不仅没有帮助,而且是有害的。
“什么时候会有人再信任你?”何问。