三、考试结果分析和社会评价、试卷的设计
为积累综合考试命题工作的经验,2000年理科综合能力测试结束后,我们通过到试点省调查、分析统计数据等形式对综合考试的情况进行了分析和总结。现从以下几方面予以介绍。
1.考试目标和内容
前面介绍了2000年理科综合能力测试计划考查的目标和内容,表2-3说明了实际考查的目标和内容。
从上述表中不难看出,山西卷中理化生三科的单科试题(以学科内综合为主)占分比例分别是31.2%、17.7%和17.7%,学科间综合内容(含理化生中2科或3科内容)的试题占分比例为33.4%(见表2);三省卷中理化生三科单科试题的占分比例分别是37.3%、22.3%和11.9%,学科间综合的占分比例为28.5%(见表3)。对三省卷的具体题目和及其所占分值进行统计的结果显示,理化生三科的总分分别是103、99和58,与4∶4∶2这一比例接近,即3个学科的占分比例与课程计划规定的总课时数的比例基本相当,符合命题计划要求。从表4和5还可以看出,试卷中的大部分试题主要考查了学生对基本知识的理解能力(占87.1%),而对考生应用能力以及实验能力等的考查相对少一些。考试后反馈的信息表明,中学界对理科综合能力测试的反映不一。其中有代表性的意见认为,就单一学科来说,其考查的内容相对较少,不如以往单科试卷考查全面;各科中都有一些主干内容不能得到考查,而个别非主干内容却得到了考查,即试题内容与大纲和教材的主干内容一致性不够充分,并认为这对于全面衡量学生对单学科知识的掌握情况不利,担心会给今后的中学教学带来负面影响。阅卷老师大多是大学老师,一些教师在肯定这种考试模式的同时,也指出了考试内容偏离学科主干内容这一问题。
对于“试题内容与大纲和教材的主干内容一致性不够充分”这类问题,从教育部对高考改革的指示中似乎可以找到一些解释,教考试【1999】6号文件明确指出,“综合考试”首先是学科内综合,其次才是跨学科的综合。由于“综合卷”存在跨学科的试题,又是三科合卷,因此命题时对每一学科内容的选择一般来说要服从于试卷或试题的总体设计和构思,很难保证每一学科考查的都是各自学科基本、主干和核心的内容。当然,就学科内综合的试题来说,要做到这点是比较容易的。值得指出的是,无论是学科的主干、核心内容,还是非主干、核心内容,对学生形成完整的学科知识体系和全面落实教学大纲的要求来说,都是重要的。
2.题量
从考试结果看,试点省对题量和题型等情况反映不一,有的认为试卷的长度较为合理、题量基本适中;有的则认为题量不足,考查的知识点偏少,对中等以上水平的考生不公平,使他们不能全面施展才能,而且在考场上的剩余时间过多还会带来一定的副作用,因此希望今后试卷的题量能大一点;还有的对赋分值存有异议。例如,认为选择题的单道小题的分值偏高,考生如果做错一道就意味着要失去5、6分,比较可惜,没有过去单科卷中的选择题的赋分值(每道2—4分)合理;又如,在非选择题中,有的难题反而比容易题的分值低,导致其与学生的实际水平和智力付出不成比例。我们认为,对综合卷的评价本身就有一个按什么标准的问题,这是可以进一步讨论的。例如,适当减少题量,本来是可以增加学生的思考时间,发挥学生的思维能力的,但却影响到对知识点的覆盖度和考试的效度;又如,关于非选择题的赋分值问题,怎样才是合理的,是以其本身的难度还是以所考查的知识或能力的地位来确定呢?这也是值得研究的。
鉴于试卷的题量和赋分值都与试卷的满分值有关,因此确定试卷的满分值就变得非常重要了。我们认为确定试卷的满分值是一个比较复杂的问题,需要考虑的方面比较多,如分数如何使用的问题;分数对中学教学影响的问题。如果综合考试的分数是作为高考录取时统一划定的最低资格分,那么试卷满分是多少关系不大;如果是作为各高校的具体投档分,那就要认真研究了。2000年的情况是,综合考试分数记入总分并参与划线和投档,在实际录取中起着决定性的作用。如果将来分数还是这样使用,我们认为应该考虑对综合卷的满分作一些调整,建议在考试时间不变的情况下,适当增加理科综合能力测试试卷的满分和题量,以便与“3 2”科目组总分相当,避免试点省和非试点省市高考总分的差别,造成高校录取时对分数理解上的差异。此外,对一些中学由于理化生三科加起来才260分,而减少这三科的课时数,从而影响今后这几科教学质量的事实也不应忽视。
3.难度、区分度、信度
在制定命题计划的过程中,我们对2000年理科综合能力测试试卷的难度进行了设计,并把试卷的总体难度定位在中等水平左右。从考后全卷的统计数据看(见表6),两套卷的难度值分别为0.614和0.66,基本达到了预期的目的,但和考生考后的感觉似乎有一定的差距,他们普遍认为今年理科综合能力测试题的难度较低。实际上,如果从物理和化学两个学科的统计数据来看,2000年理科综合能力测试与1999年物理、化学的单科考试相比,难度值差别不大,如,1999年物理、化学两科全卷的得分率分别为60.9%和66.8%,2000年物理和化学两科内容的得分率为59.2%、71.2%(据江苏省的统计)。这种情况的出现可能有多种原因,首要的应该是考生对综合能力测试这种形式不熟悉和不适应。从分半信度和Alf信度来看,两套卷的信度都是可以接受的,因为对于多数为选择题的试卷来说,常用分半信度来表示其信度,系数在0.9以上比较合适,而对于多数为非选择题的试卷来说,常用Alf信度来表示其信度,系数在0.8以上比较合适。
从选择题和非选择题的统计数据看(见表7-10),山西卷选择题和非选择题的难度分别为0.62和0.26,区分度值分别为0.537和0.676;三省卷选择题和非选择题的难度分别为0.75和0.57,区分度值分别为0.715和0.778。两卷中除山西卷非选择题的难度较大外,其他指标都比较好,因为一般认为,区分度的数值达到0.3便可以接受。因此说,两卷的选择题和非选题对考生知识和能力水平的区分能力都很强。
如果从单个试题的角度看,按照区分度数值为0.3可以接受的标准,在山西和三省卷中不排除个别试题的区分度不合适的情况。从低分组到高分组(G1G2G3G4G5组)考生在选择题和非选择题上的得分看,两者的一致性在两卷中都是比较好的,也即高分组考生得高分,低分组考生得低分。从统计数据看,2000年理科综合能力测试卷的难度、区分度等各项评价指标都是符合教育测量学方面要求的。
四、对考生复习的建议
培养学生的实践能力和创新能力是实施素质教育的重要内容。今年综合卷的第25题、31题和14题(仅三省卷有此题)都是考查实验能力方面的试题,该3题的得分率均低于整卷的得分率。从评卷教师的反映看,他们认为这些题比较难评,如第25题,学生答案五花八门,有的把兔子放在试管中;有的根本不按题目要求回答,在兔子身上拉口后,往伤口上直接滴药品,这些都反应出了考生生物实验能力的薄弱,应该加强对学生生物实验能力的培养,尤其是设计实验方案能力的培养。加强实验能力的培养,既要重视分析和解释实验现象和结果(数据),以及推导实验结论能力的培养;也要重视培养设计简单实验方案的能力,这是符合自然科学是以实验为基础的科学这一特点的,也是符合素质教育的要求的。
2000年理科综合能力测试卷中理化生3个学科内容的占分比例是参照国家颁布的《全日制普通高级中学课程计划》确定的,与各学科总课时数的比例是相当的,而且命题依据的是相关学科的教学大纲,因此考生复习也应按照依据教学大纲编写的教材进行。
理科综合能力测试的目标之一是考查学生对自然科学基本概念、原理和规律的理解能力,比较重要的一个方面就是要求学生能够知道自然科学相关概念之间的联系和区别。要求学生学会在掌握基本知识基础上的融会贯通。三省卷的第24题就是考查这方面能力的,该题需要学生将光合作用和矿质元素的知识联系起来思考。从得分率和阅卷教师的反映看,建议学生在复习中要重视这方面的能力培养,注意学科内知识的融会贯通。此外,考生在审题能力和计算能力等方面还需要加强。
2000年理科综合能力测试题的编制工作是在边实践边探索的过程中完成的,基本达到了预期的设想。试题突出了对自然科学基本知识理解和运用能力以及实验能力的考查;较好地体现了自然科学的学科特点以及自然科学知识与科技进步、社会发展方面的联系。