前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TTS API部署指南:打造个性化语音合成服务

TTS API部署指南:打造个性化语音合成服务

原创
作者头像
快乐的小白
修改2024-03-01 10:28:36
5040
修改2024-03-01 10:28:36
举报
文章被收录于专栏:小白开发小白开发小白开发

使用轻量应用服务器搭建TTS文本转语音API

前言

  • 因为上篇文章有考虑到第三方API用得多了怕哪天突然不能用了,所以想着自建一个(PS:主要是没看到该公司对外公布这个接口)
  • 到处找了找看了看终于找到了一个目前可以自建的一个TTS,可以改一改做成API(不怕笑话其实也是第三方接口-edge-tts)

1.edge-tts介绍

  • Edge-TTS是一个Python库,它使用的微软的文本到语音转换。
  • 可以将文本转换为语音,并且支持多种语言和声音。

2.准备工作

  • 一台服务器,这里我推荐腾讯云轻量应用服务器,用于部署TTS服务。
  • 需要部署的文件包,部署的时候需要用。
  • 域名,如果给第三方用的话就可能需要用到。

3.特别说明

  • 本次采用的是docker方式去部署,所以服务器的环境尽量优先选择Linux环境,当然如果你是大佬,Windows环境也可以。下面我以centos7的服务器环境为例来做部署教程。
  • 因为本次所使用的库是微软的一个服务,也许可能会一直存在,也是有可能过一段时间就会被关掉,这个说不准,但是如果有新的我会再次去发布新的文章去讲解怎么使用。

4.实际运行效果

  • 使用对象存储cos作为存储运行截图(返回存储地址)

  • 使用本地存储的运行截图(返回本地地址)

5.开始部署

5.1为了方便快捷,这里我使用宝塔面板进行快速部署操作!进入腾讯云轻量应用服务器购买轻量应用服务器,选择宝塔面板。当然你可以选择centos7.6进行自己安装。

5.2 购买服务器后,过几分钟腾讯云消息里会有面板登录地址和账号密码。然后直接在浏览器里运行就可以了。

5.3 进入宝塔面板后台,会提示绑定注册宝塔账号,这块自行注册就好了。绑定成功后,左边栏选择文件,然后进入这个目录

5.4 我们创建一下目录,因为要上传代码,这块我先上传基于对象存储cos的代码(该版本会将转换好的语音上传到cos上并且返回地址)

5.5 上传完毕后,进行解压(最好是在www目录里创建一个目录来运行,免得后面搞忘记了)

5.6 解压完了后,鼠标双击edge-tts.py文件,我们要进行cos的一些配置,文件里有写明每个地方的作用,一共要配置6个地方,代码前面4个和代码后面2个!都很简单!需要配置的参数右边都有写明去哪里配置。

腾讯云对象储存开通地址https://curl.qcloud.com/f3qqvIGU

5.6 做好以上流程后(仔细检查是参数否有空格和参数是否有错误),打开左边栏的docker,如果没有安装的点击安装一下。

5.7 安装好了docker后,我们再点击左边栏的终端!进入上面存放下载的文件包的目录里,然后输入命令。命令放在下面自己执行下。

cd /www/tts
chmod +x dockerRun.sh
./dockerRun.sh

5.8 然后等待代码执行,如果出现下面的截图所示就表示运行成功

5.9 运行成功后直接输入你的服务器ip:2020 检查一下是否能访问,如果打不开,那么可能你的服务器的防火墙没有开放,这里还需要去腾讯云控制台去开通服务器的防火墙,还有宝塔面板的防火墙都需要开启下。

5.10 然后我们在浏览器里输入一下完整路径。ip:2020+需要转换的文本+配音员

    "xiaoxiao": "zh-CN-XiaoxiaoNeural",
    "xiaoyi": "zh-CN-XiaoyiNeural",
    "yunjian": "zh-CN-YunjianNeural",
    "yunxi": "zh-CN-YunxiNeural",
    "yunxia": "zh-CN-YunxiaNeural",
    "yunyang": "zh-CN-YunyangNeural",
    "xiaobei": "zh-CN-liaoning-XiaobeiNeural",
    "xiaoni": "zh-CN-shaanxi-XiaoniNeural",
    "hiugaai": "zh-HK-HiuGaaiNeural",
    "hiumaan": "zh-HK-HiuMaanNeural",
    "wanlung": "zh-HK-WanLungNeural",
    "hsiaochen": "zh-TW-HsiaoChenNeural",
    "hsioayu": "zh-TW-HsiaoYuNeural",
    "yunjhe": "zh-TW-YunJheNeural",
服务器ip:2020/dealAudio?text=欢迎使用tts&voice=xiaoxiao
  • text 是你需要转换的文本
  • voice 是配音员 上面自己选

5.10 上面就是腾讯云COS的部署方法,那么下面就是本地储存的部署方法,部署流程都一样就是文件包不一样,所以可以直接看上面的部署流程了就可以了,本地部署不需要去配置什么,直接安装就可以使用。

5.11 绑定一个域名,用于外部访问!最好用上ssl证书。

6.注意事项

  • 两个不能同时部署到一个服务器,因为都是一个端口,需要改一下端口等才能部署在一起。
  • 本地储存部署,如果绑定了域名的话,就需要考虑一个跨域的问题!我已经在代码里写好了,所有访问都可以,大家可以改一改改成自用或限制某些域名。
  • 再次提醒,接口不是永久有可能会突然消失。

7.结语

  • 通过本文,我们学习了如何使用轻量级应用服务器搭建TTS(文本转语音)API。这样做的好处是我们可以自己掌控这个服务,不用太过依赖第三方。我们详细介绍了在腾讯云轻量应用服务器上使用Edge-TTS库的部署过程,同时提供了使用对象存储COS和本地存储两种部署方案。

  • 作为小白,我们要时刻关注技术的变化。在本文中,我们使用了Docker来管理我们的应用,这样做不仅方便,而且还增强了应用的可移植性和可重复性。我们还提到了一些需要注意的问题,比如在同一服务器上部署多个服务时需要注意端口冲突的问题,以及在本地存储部署时需要考虑跨域访问的限制。

  • 总的来说,通过本文,我们学会了如何搭建TTS文本转语音API,并深入了解了部署过程中的一些技术细节和注意事项。作为技术人员,我们应该不断学习和探索新的技术,以便更好地应对不断变化的需求和挑战。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 使用轻量应用服务器搭建TTS文本转语音API
  • 前言
  • 1.edge-tts介绍
  • 2.准备工作
  • 3.特别说明
  • 4.实际运行效果
  • 5.开始部署
  • 6.注意事项
  • 7.结语
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档