前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >轻松快速搭建一个本地的语音合成服务

轻松快速搭建一个本地的语音合成服务

作者头像
夜雨飘零
发布2023-10-23 09:05:03
4120
发布2023-10-23 09:05:03
举报
文章被收录于专栏:CSDN博客CSDN博客

前言

本文将介绍一个可以快速搭建本地语音合成的服务,模型和代码已全部提供,不需要联网运行。项目使用的是VITS模型结构,能够很轻松地启动服务。

安装环境

  1. 安装Pytorch。
代码语言:javascript
复制
# 安装CPU版本的Pytorch
conda install pytorch torchvision torchaudio cpuonly -c pytorch
# 安装GPU版本的Pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
  1. 安装其他依赖库。
代码语言:javascript
复制
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

启动服务

  1. 执行server.py程序,启动上传音频文件识别服务。
代码语言:javascript
复制
python server.py

Android应用

使用Android Studio打开源码中的AndroidClient目录,这是一个Android应用源码,打开之后首先就要修改服务t地址TTS_HOST,将它修改为你上面使用的服务器IP地址,点击运行安装到Android手机上。

应用效果图:

知识星球
知识星球
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2023-10-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 安装环境
  • 启动服务
  • Android应用
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档