前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >chatTTS 最强文字转语音模型本地部署!

chatTTS 最强文字转语音模型本地部署!

作者头像
zz_jesse
发布2024-07-05 10:24:49
2170
发布2024-07-05 10:24:49
举报
文章被收录于专栏:前端技术江湖

今天本地部署了下传说中的语音合成大模型chatTTS,合成效果非常不错,比市面上其他工具合成的感情更丰富,语气更自然一些,一起来听听。

英文:

React apps are made out of components. A component is a piece of the UI (user interface) that has its own logic and appearance. A component can be as small as a button, or as large as an entire page.

中文:

React 应用程序是由 组件 组成的。一个组件是 UI(用户界面)的一部分,它拥有自己的逻辑和外观。组件可以小到一个按钮,也可以大到整个页面。

自我介绍:本人经过三年多扎实的工作实践,现已能够独立操作整个外贸流程。工作踏实、细致、专心。具有较好的文字组织能力,有肯定的英语听说读写能力。

亮点

对话式 TTS: ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。

精细的控制: 该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。

更好的韵律: ChatTTS 在韵律方面超越了大多数开源 TTS 模型,提供预训练模型以支持进一步的研究和开发。

windows上部署

部署非常简单,下载安装包即可使用。

  1. 下载压缩包(链接在文章最后),解压后双击 app.exe 即可使用
  2. 某些安全软件可能报毒,请退出或使用源码部署
  3. 英伟达显卡大于4G显存,并安装了CUDA11.8+后,将启用GPU加速

mac上部署

git仓库:https://github.com/jianchang512/chatTTS-ui?tab=readme-ov-file

  1. 配置好 python3.9-3.11 环境,安装git ,执行命令 brew install libsndfile git python@3.10 继续执行
代码语言:javascript
复制
export PATH="/usr/local/opt/python@3.10/bin:$PATH"

source ~/.bash_profile 

source ~/.zshrc

2.创建空目录 /data/chattts 执行命令 cd /data/chattts

代码语言:javascript
复制
git clone https://github.com/jianchang512/chatTTS-ui ,然后 cd chatTTs-Ui.

3.创建虚拟环境

代码语言:javascript
复制
 python3 -m venv venv
  1. 激活虚拟环境
代码语言:javascript
复制
 source ./venv/bin/activate
  1. 安装依赖
代码语言:javascript
复制
 pip3 install -r requirements.txt
  1. 安装torch ,安装2.3版本也可以(下面的命令改为2.3即可)

然后执行

代码语言:javascript
复制
pip3 install torch==2.2.0 torchaudio==2.2.0
  1. 执行 python3 app.py 启动

将自动打开浏览器窗口,默认地址 http://127.0.0.1:9966.

chatTTS web ui :

github:https://github.com/jianchang512/chatTTS-ui?tab=readme-ov-file

windows 安装包:https://github.com/jianchang512/chatTTS-ui/releases

如果打不开可直接从网盘下载:

百度网盘下载: https://pan.baidu.com/s/1FQphPdgvp80Z1KmE8HpFgA?pwd=xm65

123网盘下载:https://www.123pan.com/s/03Sxjv-HByB3.html

感谢你为本文点赞~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 前端技术江湖 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 亮点
  • mac上部署
  • chatTTS web ui :
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档