首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用xtts_v2实现文本转语音以及音色克隆

实现效果

      选择音色样本文件,输入文字,如果全部是汉字就使用zh-cn语言,否则使用en。

模型资源

基于TTS内部代码的资源,在国内下载模型很慢。可到镜像站下载后,放到指定目录。

$ tts --list_models

Name format: type/language/dataset/model1: tts_models/multilingual/multi-dataset/xtts_v2 [already downloaded]

windows下的目录地址默认位置:

C:\Users\$username$\AppData\Local\tts\

实现代码

from TTS.api import TTS

cn_text = """选择建议优先推荐 XTTS-v2:对于中英文混合语音和高质量音色需求,XTTS-v2 是最佳选择,无需复杂配置即可处理混合文本,且音色克隆功能强大。轻量级场景选择多语言 VITS:如果对速度要求较高,且能接受稍低的音色质量,可以使用多语言 VITS 模型。极致质量选择组合模型:如果需要针对每种语言使用最佳模型,可以组合中文和英文模型,但实现复杂度较高。"""def tts_cn_en():   tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2", gpu=False)   # generate speech by cloning a voice using default settings   tts.tts_to_file(text=" It took me quite a long time to develop a voice, and now that I have it I'm not going to be silent.",                   file_path="output/output.wav",                   speaker_wav="speaker/nicole-sample.wav",                   language="en")   # generate speech by cloning a voice using default settings   tts.tts_to_file(text=cn_text,                   file_path="output/cn_output.wav",                   speaker_wav="speaker/gauss-sample.wav",                   language="zh-cn")tts_cn_en()

参考资料

国内的镜像 : https://hf-mirror.com/models

优秀的模型 : tts_models/multilingual/multi-dataset/xtts_v2

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Or3qucCW4vtHqt6bSGlCdaOg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券