Audiocraft音乐生成整合包使用教程
MusicGen是一个简单可控的音乐生成模型,能够根据文本描述或音频提示生成高质量的音乐样本。
下载压缩包,下载地址: https://xueshu.fun/2867/,解压后,如下图所示,双击bat文件运行
打开软件如下图所示
浏览器访问http://127.0.0.1:7860/,即可在浏览器里操作啦!
模型将根据您提供的文本描述或音频提示生成一个音乐片段。
选择的生成的音乐时长越长,则生成等待时间会越长。2分钟的音乐可能需要大约10分钟来生成,这里为了体验感受,限制生成的音乐时长最长为30秒。
我们提供4个模型的效果体验:
Melody: 一个能够根据文本和音频输入生成音乐的模型。注意,您也可以只使用文本来生成音乐。
Small: 一个仅使用文本输入的300M transformer decoder。
Medium: 一个仅使用文本输入的1.5B transformer decoder。
Large: 一个仅使用文本输入的3.3B transformer decoder(对最长序列可能会OOM)。
领取专属 10元无门槛券
私享最新 技术干货