AI命题能彻底取代人工吗?

1 人参与

去年秋天,OpenAI发布GPT-4时,一群资深命题专家在会议室里陷入了短暂的沉默。屏幕上,这个AI系统仅用三分钟就生成了一套完整的行测题目,逻辑严密程度不亚于人类专家耗时一周的成果。这种震撼至今仍在行业里回荡,但随之而来的不是恐慌,而是一场关于命题本质的深度思辨。

AI命题能彻底取代人工吗?

命题不只是技术活

在深圳某公务员考试命题基地,有着二十年命题经验的王教授道出了关键:”AI能完美复现知识点,却捕捉不到那些微妙的社会脉动。”去年他们尝试用AI生成申论材料时发现,系统对”乡村振兴”的理解停留在数据层面,完全忽略了基层干部在田间地头遇到的那些鲜活故事。

命题本质上是一种文化编码过程。当人类专家设计题目时,会不自觉地融入对时代精神的感知、对考生心理的揣摩,甚至是对社会需求的预判。这些难以量化的维度,构成了命题工作的”暗知识”——那些我们心领神会却难以言传的经验法则。

数据背后的局限性

教育测评机构ETS的最新研究显示,AI在标准化测试命题上的准确率已达87%,但在需要创造性思维的开放式题目中,这个数字骤降至42%。更值得玩味的是,当要求AI设计考察批判性思维的题目时,系统生成的题目往往陷入固定的逻辑套路,反而暴露了其思维模式的局限性。

北京某重点中学的语文组长举了个生动的例子:”我们让学生分析《红楼梦》中王熙凤的管理智慧,AI给出的参考答案全是现代管理学术语,完全错过了中国传统人情社会的精妙之处。”

人机协作的新范式

命题专家们正在探索一种新的工作模式:让AI担任”超级助理”的角色。在上海举行的全国教师资格考试命题会上,专家组先让人工智能生成300道候选题目,然后通过”命题工作坊”的形式进行深度打磨。这个过程就像雕刻家对待璞玉——AI提供原材料,人类赋予灵魂。

这种协作带来了意想不到的效率提升。过去需要两周完成的试卷命题,现在压缩到三天,而且题目的多样性显著增加。更重要的是,专家们得以从繁琐的重复劳动中解放出来,专注于题目的创新性和区分度设计。

那些无法被算法化的瞬间

某次高考命题封闭期间发生的一幕令人印象深刻:一位老教授在审题时突然要求修改题干中的案例,理由是这个案例可能会触动某个特定群体考生的情绪。这种基于数十年教学经验形成的共情能力,是当前任何AI系统都无法企及的。

命题不仅是科学,更是一门艺术。它需要在严谨的知识体系和灵动的人文关怀之间找到平衡点,这个平衡点的把握,往往依赖命题者那种”只可意会不可言传”的专业直觉。

当夕阳透过会议室百叶窗,投射在那些被反复修改的命题草稿上,人类专家与AI系统的对话仍在继续。这场变革不是谁取代谁的零和游戏,而是一场关于如何更好衡量人类智慧的共同探索。

所有资源来源于网络,如有侵权请联系站长。

参与讨论

1 条评论