AI命题能彻底取代人工吗?-AI发条

去年秋天，OpenAI发布GPT-4时，一群资深命题专家在会议室里陷入了短暂的沉默。屏幕上，这个AI系统仅用三分钟就生成了一套完整的行测题目，逻辑严密程度不亚于人类专家耗时一周的成果。这种震撼至今仍在行业里回荡，但随之而来的不是恐慌，而是一场关于命题本质的深度思辨。

在深圳某公务员考试命题基地，有着二十年命题经验的王教授道出了关键：”AI能完美复现知识点，却捕捉不到那些微妙的社会脉动。”去年他们尝试用AI生成申论材料时发现，系统对”乡村振兴”的理解停留在数据层面，完全忽略了基层干部在田间地头遇到的那些鲜活故事。

命题本质上是一种文化编码过程。当人类专家设计题目时，会不自觉地融入对时代精神的感知、对考生心理的揣摩，甚至是对社会需求的预判。这些难以量化的维度，构成了命题工作的”暗知识”——那些我们心领神会却难以言传的经验法则。

教育测评机构ETS的最新研究显示，AI在标准化测试命题上的准确率已达87%，但在需要创造性思维的开放式题目中，这个数字骤降至42%。更值得玩味的是，当要求AI设计考察批判性思维的题目时，系统生成的题目往往陷入固定的逻辑套路，反而暴露了其思维模式的局限性。

北京某重点中学的语文组长举了个生动的例子：”我们让学生分析《红楼梦》中王熙凤的管理智慧，AI给出的参考答案全是现代管理学术语，完全错过了中国传统人情社会的精妙之处。”

命题专家们正在探索一种新的工作模式：让AI担任”超级助理”的角色。在上海举行的全国教师资格考试命题会上，专家组先让人工智能生成300道候选题目，然后通过”命题工作坊”的形式进行深度打磨。这个过程就像雕刻家对待璞玉——AI提供原材料，人类赋予灵魂。

这种协作带来了意想不到的效率提升。过去需要两周完成的试卷命题，现在压缩到三天，而且题目的多样性显著增加。更重要的是，专家们得以从繁琐的重复劳动中解放出来，专注于题目的创新性和区分度设计。

某次高考命题封闭期间发生的一幕令人印象深刻：一位老教授在审题时突然要求修改题干中的案例，理由是这个案例可能会触动某个特定群体考生的情绪。这种基于数十年教学经验形成的共情能力，是当前任何AI系统都无法企及的。

命题不仅是科学，更是一门艺术。它需要在严谨的知识体系和灵动的人文关怀之间找到平衡点，这个平衡点的把握，往往依赖命题者那种”只可意会不可言传”的专业直觉。

当夕阳透过会议室百叶窗，投射在那些被反复修改的命题草稿上，人类专家与AI系统的对话仍在继续。这场变革不是谁取代谁的零和游戏，而是一场关于如何更好衡量人类智慧的共同探索。

所有资源来源于网络，如有侵权请联系站长。

AI命题能彻底取代人工吗?