首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

云知声“声音克隆”迭代升级,TTS“声”态体系进一步完善

“玛丽有只小羊羔,雪球儿似一身毛…… ”19世纪末,第一台留声机问世。这个“会说话的机器”,通过唱针在旋转圆筒上的螺纹移动,让声音得以保存、重现,让声音克隆的奇迹轰动世界。

如今,人们想要克隆声音,已经不再需要留声机——运用云知声的“声音克隆”技术,我们可以采集想要留存的声音,并经过深度学习算法训练,模拟出极其类似或几乎无法区分的声音,并将之运用到生活的方方面面。

近日,云知声“声音克隆”完成新一轮迭代升级:

一是完成技术升级,鲁棒性更高,即在原始录制质量不是很理想的情况下,也可以稳定生成较高质量的合成语音。换句话说,此次升级不仅对录音质量的要求更低,而且克隆出的声音质量也将更上一层楼;

二是为满足对音频质量要求更高的场景需求,此次升级增加了100句声音克隆功能。用户录制100句音频,生成的个人音库较录制20句音频合成的效果更逼真、更自然;

三是可根据自定义文本进行语音录入。简单来说,过往“声音克隆”需要用户按照既定文本进行语音录入,而现在用户只需导入一段音频,即可实现声音克隆。用户可根据自己的实际应用需求,输入更贴合场景的个人音频,从而实现合成语音与具体场景的深度结合。

伴随此次“声音克隆”的迭代升级,云知声围绕TTS构建的AI语音“声”态得以进一步完善。

成品TTS:为机器装上“嘴巴”,像人一样“开口说话”

TTS全称为“Text-to-Speech”,是一种将文本自动转换为语音的技术。它利用计算机语音合成技术,将输入的文本转化为自然流畅的人类语音输出。在TTS技术的加持下,机器得以像人类一样“开口说话”,我们日常生活中的手机语音助手、语音导航播报、有声阅读APP都是基于TTS技术实现的。

以智能语音起家的云知声,面向各个领域提供行业领先的TTS产品方案。目前,云知声TTS包含十余种音色和十余种情感风格,可满足企业人机对话、短视频制作、电话客服等多种场景需求。

定制化TTS:玩转“分身特技”,打造个性化音色

每个人都有自己独一无二的声音,不同人的声音有着不同的语调、不同的尾音,这些声音就如同每个人的面孔,是我们构成独特身份的特征。

云知声“音库定制”可根据客户需求,在千句级别的录音上进行深度定制音色,打造专属IP发音人,让同一个定制音色在不同空间为不同的人提供服务,满足企业在市场品牌推广和产品应用中的语音诉求。

当然,定制化TTS并不专属于企业级用户。为了让每个普通人都能感受这项技术的魅力,云知声于今年年初上线“声音克隆”功能,用户仅需录制20句原始音频,即可合成个人音库,轻松体验声音克隆的乐趣。

此次迭代升级在提高技术稳定性的同时,新增自定义文本录入功能与100句复刻功能,从而克隆出更自然、更逼真、更贴合用户场景化需求的声音,可应用于车载导航、儿童点读机、新闻播报、短视频配音、智能客服等,让用户的声音在不同场景中焕发新“声”。

在AIGC蓬勃发展的关键时期,TTS扮演着重要角色——促进多模态交互,增强辅助功能,让机器的语言更逼真、自然、流畅,全面提升用户体验。目前,云知声TTS产品已覆盖智能客服、语音交互、导航播报等众多应用场景,并助力广州地铁、世茂集团等多家行业头部企业实现AI语音能力的应用与拓展。

未来,伴随山海大模型能力的持续拓展,云知声也将探索大模型与TTS技术的有效结合,持续为用户体验和业务增长注入创新势能,以实现更大用户价值。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OksACvnBrlYvx0TK-bL5ovfQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券