如果音乐创作者能有一个共同头脑风暴的伙伴,在他们创作受阻时提供帮助,并共同探索不同音乐方向,难道不是很好吗?KAIST和卡内基梅隆大学(CMU)的研究人员开发了一种类似于帮助创作音乐的作曲伙伴的AI技术。
KAIST(校长李光炯)通过与CMU合作,由电气工程学院李成柱教授领导的研究团队开发了基于AI的音乐创作支持系统Amuse。该研究在4月26日至5月1日于日本横滨举行的ACM计算系统人为因素会议(CHI)上发布,这是人机交互领域全球顶级会议之一,并获得了仅授予投稿前1%的最佳论文奖。
李成柱教授团队开发的Amuse系统是基于AI的智能系统,能将文本、图像和音频等多种形式的灵感转化为和声结构(和弦进行)以支持作曲。例如,如果用户输入“温暖夏日海滩的回忆”等短语、图像或声音片段,Amuse会自动生成并推荐与灵感匹配的和弦进行。
与现有生成式AI不同,Amuse的差异化在于尊重用户的创作流程,通过允许灵活整合和修改AI建议的交互方式,自然地引导创意探索。Amuse系统的核心技术是融合两种方法的生成技术:大型语言模型基于用户提示和灵感生成音乐代码,而另一个通过真实音乐数据训练的AI模型使用拒绝采样过滤生硬或不自然的结果。
研究团队针对实际音乐人开展用户研究后评估认为,Amuse作为“共创AI”(人类与AI协作的概念)具有巨大潜力,而非让生成式AI单纯拼凑歌曲。李成柱教授表示:“最近的生成式AI技术因直接模仿受版权内容引发担忧,可能侵犯创作者版权,或单向生成结果忽视创作者意图。研究团队关注创作者实际需求,聚焦于设计以创作者为中心的AI系统。Amuse是在保持创作者主导权前提下探索与AI协作可能性的尝试,有望成为未来音乐创作工具和生成式AI系统更友好发展方向的起点。”
领取专属 10元无门槛券
私享最新 技术干货