AI发条(aifatiao.com)7月18日 消息:由于离散声学标记建模的发展,最近在语音和音乐的自回归创建方面取得了重大改进。研究人员开发了一种名为 VampNet 的音乐生成方法,它利用了声学token建模和并行迭代解码的技术。
据称,VampNet 可以用于音乐合成、压缩、填充和变体等多个应用领域。
研究人员使用基于token的提示来指导 VampNet 的创作,展示了其填补空白的能力。VampNet 可以根据不同的提示设计产生音乐的变体,包括循环和变化。该方法可以在音乐压缩和音乐制作之间进行平滑过渡。
在适当的提示下,VampNet 能够保持音乐的风格、流派、乐器和其他高级方面,同时改变了音色和节奏的一些细微差别。他们的方法允许将提示放在任何地方,这与自回归音乐模型不同,自回归音乐模型只能通过利用一些原始音频作为提示并让模型扩展音乐内容。 这种灵活的提示能力使 VampNet 成为强大的音乐共同创作工具。
使用智能工具和模型预测自动进行标记以节省时间。音乐家可能会使用 VampNet 录制一个简短的循环,将其输入到系统中,并让 VampNet 在每次重复循环区域时根据这个想法生成音乐变体。
论文地址:https://arxiv.org/abs/2307.04686
(本文转载自站长之家)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...