浙江新高考的问题很多,但创新也不少,我准备一一剖析。当然,我在这个回答里做了一个总领性的说明,以及预判:积弊久矣,如果不改变现有做法,未来还会出现更多的问题。建议在阅读本文前先阅读这个答案
如何看待浙江省公布2018年11月高考英语加权赋分一事调查结果:存在决策严重错误,多名相关人员被撤职? – 余ppp的回答 – 知乎 https://www.zhihu.com/question/304749606/answer/545864324
本文则先从最表象上出问题的评分制度进行剖析,需要说明的是,其实我在本文的观点在2016年就已经形成,并且我基于此预判了之后高考将会出现 “得语文者得天下”的局面

认识我的朋友都知道,我是复旦统计学士+哥大统计硕士,所以在如何赋分调整方面,我不同于别的人给出“无药可救”的结论,而是要尽量以自己之所学,给出合理可行的方法,

深入剖析和评论褒贬不是为了破坏性地抱怨,永远是为了建设性的意见。

在讨论评分技术之前,需要思考一个前置的疑问,即:什么样的评分是公平的?
然后带着这个问题来看不同的评分方式,这样才能看出这些评分方式出了什么问题。
我认为答案就是:评分需要能够正确反映考生的能力在所有考生中的顺位
或者叫 公平排位
(再强调一次,分数不重要,比得是排名)

这条说起来容易,其实设计起来并不容易,让我们再来看这几种打分方式,当然中间会穿插一些原委和背景:
1.传统的高考和目前语数上的直接打分模式(以下简称传统打分模式)
2.新高考在选考科目上的赋分模式(以下简称新高赋分模式)
3.新高考在英语上的打多次分取高分模式(以下简称多次取高模式)
传统打分其实并没有做到“公平排位”,(当然要想绝对做到也是不可能的),或者说存在瑕疵,但是这种瑕疵并不大,而且直接打分显然操作简单,而且透明性高,所以一直以来都没有太大的问题。但是随着时间的推移,大家对于高考关注度越来越重,所以两个小瑕疵就暴露了出来。
一个小瑕疵a:传统打分模式是一种伪等权制。举个例子:语文和数学都是150分,看起来这两门课的权重是一样的,但是实际上这两门权重完全不同,这是因为两者的评分区间不同。通常大家会有一个特别直观的感受,就是语文上的分差是拉不太开的,一个水平差不多的班级里,大家可能都在100分上下,但是数学上就能拉开20-30分。如果还是不能理解,那就看一下每次考试之后,全班数学最高分和最低分之间的分差,以及语文最高分和最低分之间的分差,通常都是前者要远大于后者。
由于高考比拼的是总分,无论各门课的评分区间是大是小,最后分数都要加在一起算,所以这就导致了理科好但文科弱的同学要比文科好但理科弱稍占一些优势。为了尽量使得文理科平衡,所以浙江开始引入了新高赋分模式,这样至少可以保证赋分的三门课程之间是等权重的
不得不说,赋分这一方法方式无论是初衷还是理论上都是有好处的,但是可惜的是,新高赋分的方法用的是均匀分布,这反而出现了问题,更引入了新的问题。(这些问题将在本篇文章中下篇做出说明)

另一个小瑕疵b是传统打分模式的“一考定终生”,这涉及到考场发挥的随机性。很多老师一直强调的一点是:考试考得不仅是分数,更是稳定性。稳定性指的是,考出来的成绩不要浮动很大,因为虽然考坏了有复读,但是消耗一年的青春约等于消耗人生的1/40,这个代价是非常昂贵的。如果考试的稳定性很差,那么就会有大量考生的考分严重偏离自己的平时成绩,自然是谁都不乐意见到的。
为了说明稳定性的重要,还要引入一个心理学上观察,即: 人总是记住自己最强的状态,并容易以此作为衡量。比如我曾经跑出过百米10s,那我就会觉得我应该下次也要跑出10s,即使我的训练成绩通常在10.5s,即使跑出最好成绩那天可能刚好风向合适。
回到考试这个事例上,很多同学也都会用自己曾经考出的最好成绩来估计自己的高考成绩,或者说,明显有较高的预期。这一点在家长身上尤其明显,大量家长会抱怨说,自己的孩子高二就考到过年级前100了,高考怎么着也应该名次更往前。这一种心态很好地解释了一个现象,就是为什么在高考完了之后,去问一圈,永远是绝大多数的同学都会告诉你,“我高考失误了,我平时更好的”。从概率上来说,失误的和超常的人应该是55开的,但实际上大家会认为没有接近或超过自己的历史最高分就是失误。
是不是会观察到这样的现象:大多数家长都认为自己的娃在未来的考试中会进步。认为自己的娃可聪明了,只要更努力一点,(或者说:不是不聪明,而是不够努力)下一次考试就能超过历史成绩。所谓的进步不就是超越自己之前的排名,把其他的娃超过去么?明明大家都是一样付出12分的努力。最可怕的是这些家长永远拒绝认清自己娃的水平的,甚至一说就会炸毛。
扯得远了,其实我在这里不想过多评价这种心理,我只想说,“一考定终生”中由随机性带来的预期差,与其说是不公平,其实更多的是不符合"人性",但造成的结果是破坏力非常惊人,一个典型的结果就是额外造成了不少的“高复生”(下篇中会解释为什么新高考中高复生会特别多)
为了解决这种“一考定终生”的瑕疵b,所以浙江在英语上首先做出了尝试,采用了多次取高模式,这种方式是可以解决瑕疵b,并且特别符合考生的用历史最高分衡量自己的心理,是一种初衷非常好的尝试,只可惜解决瑕疵b的同时也引入了多次取高模式的弊病。

接下来来说多次取高模式。

多次取高模式之所以可行,是因为有一个先决条件:每一次考试的成绩是可比的

这一次浙江英语出问题,考试院迫不得已要去改分,就是因为出现了本次英语的难度偏高,说白了就是和之前的英语考试不可比了。
我在之前的回答中提出了:
那为了保证以后的公平,是不是要保证每一次考试考出来的难度要一致,分数均值要一致,方差要一致,甚至分数分布要一致?这是不可能完成的啊!是的,就像世界上没有两条一样的河流一样,世界上是不会有一样的考试的。想要直接通过出题就出出来接近可比的两场考试是不可能的。更何况现在是“要永久保持每次英语考试结果的分布要一致”,因为每次参加英语高考的都是两届同学。

这是做不到的!

其实只有一个近似的解决办法的,就是每一次的英语考试都进行赋分,全部都赋分到同一个分布上!从而达到每次的考试结果接近
没错,浙江高考中最需要赋分的科目是要考多次的英语,所以这次要偷偷赋分其实是有合理的地方的,只可惜浙江省考试院里面的人数学水平有限,用错了赋分的方法,而且可能还做了很多不必要的小动作。

接下来,我们正好来讨论新高赋分模式的问题,讨论完了之后,我们再来说什么是好的赋分方式。
(之前的论述我尽量用通俗的语言,但是接下来,需要用到一些概率论的基础知识。)

(上篇 完)

为了解释清楚整个问题,除了这个 “浙江新高考的问题及解决办法——赋分篇”上下篇写完后,我会再写一篇“浙江新高考的问题及解决办法——方向篇”,以及“浙江新高考的问题及解决办法——改革篇”,分别讲高考该往哪个方向发展,以及如果由我来着手,我会如何务实地逐步改革目前的困局。

20181207更新
浙江新高考的问题及解决办法——赋分篇(下)

浇花的水里加入这5种物质 保证长势旺盛
海口市桂林洋是属于琼山区吗?

Leave a Comment

Your email address will not be published. Required fields are marked *