大家好啊,我是小松鼠,
作为白桃小师姐的好友,我一直有一个梦想,就是做一个小世界的鬼畜视频。无奈的是,菜菜的我真的学不会AU和PR,迫不得以暂时放弃了这个梦想。直到前几天,我刷GitHub的时候发现了这个项目,MockingBird!
首先让我先来简单的介绍一下MockingBird,他是一个AI拟声项目,可以在5秒内克隆您的声音并生成任意语音内容,比如这个~
https://github.com/babysor/MockingBird
让我们来看看效果如何,由于小松鼠是笔记本,扛不住训练模型的算力,无奈只能使用别人训练好的模型进行生成,效果不是很理想,不过作为鬼畜音源绝对是够了。完了,小师姐不会拉黑我吧QAQ!
虽然这项目相对于接触过深度学习的人很简单,但是考虑到大多数读者没有相关的前置知识,所以本文小松鼠会讲解的详细一些,并且把项目的流程做了一些简化,如果相追求更好的效果,大家可以去看前面的项目地址,围观大佬操作
下载anaconda并安装,地址如下。安装好后手动添加环境变量,两个地址到用户变量Path
https://www.anaconda.com/
打开Anaconda promot创建一个环境。
conda create -n your_name jupyter notebook #your_name换成你想给项目命名的名字
安装好环境后我们打开Anaconda,将新建的虚拟环境设置为活动环境
根据电脑cuda版本安装pytorch,可以在NVIDIA控制面板查看cuda版本
打开pythorh官网,根据你的cuda版本选择安装命令,注意使用pip进行安装
https://pytorch.org/get-started/locally/
复制代码到Anaconda promot中执行(我这里是已经安装过了)
接下来安装 ffmpeg,我这里已经帮大家下载好了,大家直接下载就好
https://wwe.lanzouw.com/iOpxFy9yvjc
下载完毕直接解压,将这个路径作为环境变量添加到path中
在cmd面板中输入ffmpeg检查是否安装正确
在项目地址中下载项目源文件,解压放在随便一个盘的目录里,比如我就是放在了D盘的根目录中
打开cmd面板,输入D:进入C盘,接下来输入cd+文件路径进入文件目录
D:
cd D:\MockingBird-main\MockingBird-main
输入下方命令安装所需要的包
pip install -r requirements.txt
安装 webrtcvad
pip install webrtcvad-wheels
这个嘛模型大家可以选择自己训练,或者使用社区共享的开源模型,看自己电脑配置和需求了,这里使用社区共享的模型,下载一个就够了
下载地址:
https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 百度盘链接 4j5d
https://pan.baidu.com/s/1fMh9IlgKJlL2PIiRTYDUvw 百度盘链接 提取码:om7f
https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024
https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021
下载完毕以后解压到synthesizer文件夹里面的saved_models(没有就创建一个)
然后在cmd面板输入python+demo_toolbox.py文件路径
python D:\MockingBird-main\MockingBird-main\demo_toolbox.py
运行结果如下,先导入预先准备好的音频文件,播放一下,然后暂停,点击右上方synthesize and vocod生成音频预览