前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >我克隆了白桃小师姐的声音,她应该不会打我吧~~~

我克隆了白桃小师姐的声音,她应该不会打我吧~~~

作者头像
陈南GISer
发布2022-01-05 10:29:42
9060
发布2022-01-05 10:29:42
举报
文章被收录于专栏:点点GIS

大家好啊,我是小松鼠,

作为白桃小师姐的好友,我一直有一个梦想,就是做一个小世界的鬼畜视频。无奈的是,菜菜的我真的学不会AU和PR,迫不得以暂时放弃了这个梦想。直到前几天,我刷GitHub的时候发现了这个项目,MockingBird!

首先让我先来简单的介绍一下MockingBird,他是一个AI拟声项目,可以在5秒内克隆您的声音并生成任意语音内容,比如这个~

项目地址:
代码语言:javascript
复制
https://github.com/babysor/MockingBird

让我们来看看效果如何,由于小松鼠是笔记本,扛不住训练模型的算力,无奈只能使用别人训练好的模型进行生成,效果不是很理想,不过作为鬼畜音源绝对是够了。完了,小师姐不会拉黑我吧QAQ!

下面来讲讲这个项目怎么玩吧

虽然这项目相对于接触过深度学习的人很简单,但是考虑到大多数读者没有相关的前置知识,所以本文小松鼠会讲解的详细一些,并且把项目的流程做了一些简化,如果相追求更好的效果,大家可以去看前面的项目地址,围观大佬操作

配置深度学习环境

下载anaconda并安装,地址如下。安装好后手动添加环境变量,两个地址到用户变量Path

代码语言:javascript
复制
https://www.anaconda.com/

打开Anaconda promot创建一个环境。

代码语言:javascript
复制
conda create -n your_name jupyter notebook  #your_name换成你想给项目命名的名字

安装好环境后我们打开Anaconda,将新建的虚拟环境设置为活动环境

根据电脑cuda版本安装pytorch,可以在NVIDIA控制面板查看cuda版本

打开pythorh官网,根据你的cuda版本选择安装命令,注意使用pip进行安装

代码语言:javascript
复制
https://pytorch.org/get-started/locally/

复制代码到Anaconda promot中执行(我这里是已经安装过了)

接下来安装 ffmpeg,我这里已经帮大家下载好了,大家直接下载就好

代码语言:javascript
复制
https://wwe.lanzouw.com/iOpxFy9yvjc

下载完毕直接解压,将这个路径作为环境变量添加到path中

在cmd面板中输入ffmpeg检查是否安装正确

在项目地址中下载项目源文件,解压放在随便一个盘的目录里,比如我就是放在了D盘的根目录中

打开cmd面板,输入D:进入C盘,接下来输入cd+文件路径进入文件目录

代码语言:javascript
复制
D:
cd D:\MockingBird-main\MockingBird-main

输入下方命令安装所需要的包

代码语言:javascript
复制
pip install -r requirements.txt

安装 webrtcvad

代码语言:javascript
复制
pip install webrtcvad-wheels
准备预训练模型

这个嘛模型大家可以选择自己训练,或者使用社区共享的开源模型,看自己电脑配置和需求了,这里使用社区共享的模型,下载一个就够了

下载地址:

代码语言:javascript
复制
https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 百度盘链接 4j5d
https://pan.baidu.com/s/1fMh9IlgKJlL2PIiRTYDUvw 百度盘链接 提取码:om7f
https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024
https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021

下载完毕以后解压到synthesizer文件夹里面的saved_models(没有就创建一个)

开始玩耍

然后在cmd面板输入python+demo_toolbox.py文件路径

代码语言:javascript
复制
python D:\MockingBird-main\MockingBird-main\demo_toolbox.py

运行结果如下,先导入预先准备好的音频文件,播放一下,然后暂停,点击右上方synthesize and vocod生成音频预览

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 点点GIS 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 项目地址:
  • 下面来讲讲这个项目怎么玩吧
  • 配置深度学习环境
  • 准备预训练模型
  • 开始玩耍
相关产品与服务
命令行工具
腾讯云命令行工具 TCCLI 是管理腾讯云资源的统一工具。使用腾讯云命令行工具,您可以快速调用腾讯云 API 来管理您的腾讯云资源。此外,您还可以基于腾讯云的命令行工具来做自动化和脚本处理,以更多样的方式进行组合和重用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档