Audiocraft音乐生成整合包使用教程

文章来源：企鹅号 - 助考笔记

MusicGen是一个简单可控的音乐生成模型，能够根据文本描述或音频提示生成高质量的音乐样本。

下载压缩包，下载地址： https://xueshu.fun/2867/，解压后，如下图所示，双击bat文件运行

打开软件如下图所示

浏览器访问http://127.0.0.1:7860/，即可在浏览器里操作啦！

模型将根据您提供的文本描述或音频提示生成一个音乐片段。

选择的生成的音乐时长越长，则生成等待时间会越长。2分钟的音乐可能需要大约10分钟来生成，这里为了体验感受，限制生成的音乐时长最长为30秒。

我们提供4个模型的效果体验:

Melody: 一个能够根据文本和音频输入生成音乐的模型。注意,您也可以只使用文本来生成音乐。

Small: 一个仅使用文本输入的300M transformer decoder。

Medium: 一个仅使用文本输入的1.5B transformer decoder。

Large: 一个仅使用文本输入的3.3B transformer decoder(对最长序列可能会OOM)。

相关快讯