去年秋天,OpenAI发布GPT-4时,一群资深命题专家在会议室里陷入了短暂的沉默。屏幕上,这个AI系统仅用三分钟就生成了一套完整的行测题目,逻辑严密程度不亚于人类专家耗时一周的成果。这种震撼至今仍在行业里回荡,但随之而来的不是恐慌,而是一场关于命题本质的深度思辨。

在深圳某公务员考试命题基地,有着二十年命题经验的王教授道出了关键:”AI能完美复现知识点,却捕捉不到那些微妙的社会脉动。”去年他们尝试用AI生成申论材料时发现,系统对”乡村振兴”的理解停留在数据层面,完全忽略了基层干部在田间地头遇到的那些鲜活故事。
命题本质上是一种文化编码过程。当人类专家设计题目时,会不自觉地融入对时代精神的感知、对考生心理的揣摩,甚至是对社会需求的预判。这些难以量化的维度,构成了命题工作的”暗知识”——那些我们心领神会却难以言传的经验法则。
教育测评机构ETS的最新研究显示,AI在标准化测试命题上的准确率已达87%,但在需要创造性思维的开放式题目中,这个数字骤降至42%。更值得玩味的是,当要求AI设计考察批判性思维的题目时,系统生成的题目往往陷入固定的逻辑套路,反而暴露了其思维模式的局限性。
北京某重点中学的语文组长举了个生动的例子:”我们让学生分析《红楼梦》中王熙凤的管理智慧,AI给出的参考答案全是现代管理学术语,完全错过了中国传统人情社会的精妙之处。”
命题专家们正在探索一种新的工作模式:让AI担任”超级助理”的角色。在上海举行的全国教师资格考试命题会上,专家组先让人工智能生成300道候选题目,然后通过”命题工作坊”的形式进行深度打磨。这个过程就像雕刻家对待璞玉——AI提供原材料,人类赋予灵魂。
这种协作带来了意想不到的效率提升。过去需要两周完成的试卷命题,现在压缩到三天,而且题目的多样性显著增加。更重要的是,专家们得以从繁琐的重复劳动中解放出来,专注于题目的创新性和区分度设计。
某次高考命题封闭期间发生的一幕令人印象深刻:一位老教授在审题时突然要求修改题干中的案例,理由是这个案例可能会触动某个特定群体考生的情绪。这种基于数十年教学经验形成的共情能力,是当前任何AI系统都无法企及的。
命题不仅是科学,更是一门艺术。它需要在严谨的知识体系和灵动的人文关怀之间找到平衡点,这个平衡点的把握,往往依赖命题者那种”只可意会不可言传”的专业直觉。
当夕阳透过会议室百叶窗,投射在那些被反复修改的命题草稿上,人类专家与AI系统的对话仍在继续。这场变革不是谁取代谁的零和游戏,而是一场关于如何更好衡量人类智慧的共同探索。
所有资源来源于网络,如有侵权请联系站长。
参与讨论
AI真是省事儿,省了好多加班时间。