在广告公司的一间录音棚里,资深配音演员刘老师刚完成一段情感浓厚的旁白,隔壁的编辑却在用AI配音软件把同一稿件生成了两种不同风格的声音。现场的对比让人不禁思考:技术已经逼近了人声的极限,AI配音真的能把“真人配音”这座山峰搬走吗?

基于深度神经网络的声码器在过去五年里将语音自然度提升至95%以上,公开的M‑OSCAR评测显示,中文普通话的“人类相似度”已突破0.92。与此同时,多模态模型能够同步捕捉情感标签,实现“悲伤”“激昂”等细腻情绪的音色切换。
即便算法能模拟哭腔或低沉,却难以复制演员对剧本的个人解读。一次纪录片配音时,导演要求配音演员在关键转折处加入“轻微的呼吸声”。AI模型虽然可以添加噪声,却无法把握“呼吸的节奏”和“情绪的张力”。这类细节往往决定观众的共鸣强度。
国内已出台《生成式语音服务管理办法(征求意见稿)》,明确标注AI生成语音的义务。大型平台在2023年引入了“AI配音版权分成”,为声音模型的训练数据来源设立了追溯机制。可见,技术渗透的同时,法律框架也在同步构筑防线。
“AI是工具,而非全能替代者。”——北京语言大学声音实验室张教授
所有资源来源于网络,如有侵权请联系站长。
参与讨论
有些广告听着特假,一听就是机器读的,那种还是得真人来吧。