首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

只需几秒就可生成2分钟歌曲!4个学霸带来王炸级AI音乐工具,以后想听什么自己写

“二月天杨柳醉春烟,三月三来山青草漫漫,最美是人间四月的天,一江春水绿如蓝……”

先请大家听一首歌曲,全新演绎的抒情版《上春山》。

如果我说,我只用了不到1分钟就完成了作曲部分,你信吗?

生成式人工智能,又出王炸产品:输入几个提示词,像是内容主题、音乐流派风格,或者直接喂给AI一段古诗词,等待几秒到几十秒,就可以生成一首长达一两分钟的歌曲。而且,目前无需排队申请,登录后可直接上手免费试玩。

资深媒体人、著名电台DJ杨樾试用Suno后,忍不住在朋友圈感慨:“AIGC热潮自前年12月涌现之后,我一直对自己从业近30年的音乐行业保有一份最后坚守的乐观,觉得AI替代人生成音乐还相对比较难”“直到昨夜,我尝试了AI音乐工具Suno的V3版,这是我用它测试做的第一首歌,做出来我真是百感交集,那一刻既兴奋又幻灭,兴奋于AI真的可以替代人做音乐了,幻灭于音乐的创作与表达手艺可能要颠覆了,这个行业也要变天了……

AI音乐的ChatGPT时刻到了?

一家位于美国麻省剑桥的AI初创公司Suno,本周发布Suno模型V3版本。任何人,哪怕五音不全,毫无音乐创作功底,只需一个简单的文本提示,就可以秒出一首最长达2分钟的歌曲。

他们还给用户创作并提交的AI歌曲创建了排行榜。目前上榜的人气歌曲中,有不少中文曲目。用提示词“中国传统民乐、慢板、空灵、天使之音”生成的《水调歌头(明月几时有)》,挤进了前三。

排在第六位的《宫保鸡丁》创作于昨天,用户上传的歌词居然是一份完整的菜谱!

我决定自己上手试试。

先来一首舒缓情歌,输入提示词:A smooth hip hop song about wanting to be with you(一首平和流畅的嘻哈歌曲,关于想和你在一起) 。

20多秒后,Suno生成了男女声两个版本。嗯,还怪好听的。

再来试试中文能力。直接将李白的七言歌行《将进酒》“喂”给AI,“君不见,黄河之水天上来,奔流到海不复回……”指定hip pop风格。生成的结果,你们听了觉得如何?

这个周末,海内外社交平台上的网友们将Suno玩出了花,甚至把ChatGPT(生成歌词)、Midjourney(生成歌曲封面)以及Runway gen2(生成歌曲MV画面)等AI工具结合起来使用。

有人投喂周杰伦的歌词,表示生成结果很满意;有人惊呼,AI音乐的ChatGPT时刻是不是已经来了;也有人说,如果古诗词都能以这种形式唱出来,儿时背诵可能就没那么难了……

还有达人多次试玩后,总结出一套比较理想的提示词模式:音乐流派(如Kpop、Heavy Metal)、音乐风格(如Slow、Broadway)、情绪(如悲伤、愤怒)、乐器(如钢琴、吉他)、主题或场景、人声描述(如愤怒的男声、忧伤的女声)。

目前,Suno面向所有人免费开放试玩,每人每天送50积分。同一段提示词,同时出2首歌曲,消耗10积分,所以,每天能创作5个内容主题的10首歌曲。

4个学霸创始人

想要人人都能制作专业级歌曲

过去的一年多,生成式 AI 在文本、图像甚至是视频领域都取得了重大突破。然而,音频,尤其是音乐,似乎一直处于滞后状态。Suno最新发布的V3版本,似乎正在解开AI音乐的秘密。“希望看到音乐制作的大众化,每个人都能制作出属于自己的专业级歌曲。 ”

“我们热爱编写代码、创作音乐和品尝咖啡。我们的企业文化围绕音乐和声音实验展开——从午餐时间的闲聊,到我们办公室里的录音室。”在Suno官网,团队介绍中这样写道。

另据Rolling Stone(《滚石》杂志)3月17日报道,Suno成立不到两年,目前有员工12人,公司临时办公点距离剑桥大学仅几步之遥。

4位联合创始人Mikey Shulman、Keenan Freyberg、Georg Kucsko和Martin Camacho,都是机器学习方面的专家,此前曾一同就职于人工智能公司Kensho。

其中,拥有哈佛大学物理学博士学位的Mikey Shulman,以及毕业于哈佛大学计算机科学和数学专业的Camacho也是音乐家,工作之余常常一起即兴演出。

Mikey Shulman和Martin Camacho

Georg Kucsko同样是哈佛大学物理学博士毕业,而Keenan Freyberg本科毕业于乔治华盛顿大学。

Georg Kucsko和Keenan Freyberg

Kensho这家公司成立于2013年,专注于为大型金融机构提供人工智能分析。在那里,4人共同开发了一种转录技术,用于记录上市公司的财报电话会议。这是一个很棘手的任务,因为电话会议音频质量差,行话多,且各种口音混杂。

Suno采用的方法和ChatGPT等大语言模型的通用方法类似,即将人类语言拆分为被称为token的离散段落,吸收其数百万的使用方式、风格和结构,并按需重构。不过音频,尤其是音乐的复杂程度更高。也因此,曾有专家认为,音频领域出现重大突破,可能还要好多年。

《滚石》杂志还提到,Suno的创始人们拒绝透露正在往模型中输入的数据的详情,除了一点,即V3能生成令人信服的人类声音,部分来自于它从语音录音以及音乐中学习。

事实上,Suno也预见了接下来可能将面临的问题,比如音乐厂牌和出版商的版权诉讼。创始人们表示,充分尊重艺术家和知识产权,并正在与主要音乐厂牌进行沟通。“它不会让你在提示中请求任何特定艺术家的风格,也不会使用真正的艺术家的声音。”

“我们的想法是,尝试让十亿人比现在更加热爱音乐。”Shulman说,“如果人们更热爱音乐,更专注于创作,培养出更独特的品位,这无疑对艺术家有利。我们对音乐未来的愿景是一个对艺术家友好的世界。我们并没有想要取代艺术家。”目前,V4版本已在开发中,预计很快会上线。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OMg8BncmUSYDvTkfG-i3CmYA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券