首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

吉利新一代HAM-TTS语音合成大模型正式发布 具备声音克隆能力

易车讯 近日,吉利官方宣布星睿AI大模型又取得一项突破性技术成果—“新一代HAM-TTS语音合成大模型”正式发布。据官方介绍,新一代HAM-TTS语音合成大模型创新性地引入了文本声音学信息预测模块,能根据给定的文本,合成出自然流畅、富有情感的语音。

同时,它拥有强大的声音克隆能力,仅需几秒的参考语音样本,就能复刻出逼真的声音,给用户带来真实生动的语音交互体验。

据官方介绍,新一代HAM-TTS语音合成大模型率先突破数据收集难题,将训练数据量扩增至超65万小时,将参数量扩增至8亿。此外,吉利还采取了巧妙的数据增强策略。即通过拼接、替换等方式在训练数据中人为设置“噪音”,以此提升语音合成大模型对音色的辨识能力,让合成出来的音频音色更稳定、更连贯,更接近于人声。

同时,新一代HAM-TTS语音合成大模型也具备强大的跨语言切换能力。而且,新一代HAM-TTS语音合成大模型能够根据特定场景需求,智能调节语气、语调、停顿和情感等多维度参数。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OBn1aTrYdys7srk_PRsryRCg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券