首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Voysis为移动设备开发离线WaveNet语音合成模型

尽管经历了数十年的进步,但能够产生高度逼真的语音的人工智能(AI)平台仍然难以实现。然而,现在我们取得了进展。

2016年9月,总部位于伦敦的谷歌子公司DeepMind开发了一个深度神经网络 - 数学函数层,可以松散地模仿人类大脑的生理学 - 可以对人类语音进行采样并直接模拟波形。美国英语和普通话测试表明,它可以胜过当时最先进的文本到语音转换(TTS)系统,包括谷歌自己的系统。更好的是,它只需要两秒钟就可以生成样本。

从那时起,Google和Lyrebird等初创公司已经在生产中部署了WaveNet模型(它已被用于为Google智能助理生成语音),但到目前为止所有实施 - 包括来自Facebook和中国搜索巨头百度的实施 - 都利用了强大的云平台和定制-设计 专用集成电路(ASIC) 用于处理。(苹果公司在说,博客文章,去年,它不是像Siri的服务还没有使用,因为他们的WaveNets可行“极高的计算成本。”)但Voysis,都柏林启动,今天宣布,它开发了基于WaveNet高科技,它不仅可以脱机运行,还可以运行在智能手机和其他带有移动处理器的设备上。

Voysis将其解决方案称为ViEW或Voysis Embedded WaveNet。与其他WaveNets一样,ViEW采用卷积神经网络 - 一种将原始信号作为输入并一次合成一个输出样本的算法 - 直接处理原始音频信号。该公司称,它只需50MB即可运行 - 比Apple的Siri型号小10倍。它还利用了可用的图形芯片和其他硬件加速功能,从今天起可供Voysis客户使用。

这是模型生成的语音样本:

https://venturebeat.com/wp-content/uploads/2018/09/sample-3.wav

“ViEW,Voysis Embedded WaveNet,是语音和会话功能下一代发展的开始。这项技术打开了与任何和所有设备进行智能对话的大门。随着消费者数据在设备上本地处理,消费者隐私问题得到解决; 还解决了围绕数据中心成本,正常运行时间和维护的业务问题,“Voysis联合创始人Peter Cahill博士说。

传统的离线,边缘文本到语音系统采用称为连接的方法进行合成。从本质上讲,他们将录制的语音数据库分成小单元 - 个人 电话双音素半音,音节, 单词短语句子 - 软件智能拼接在一起。由于语音的自然变化与自动波形分割技术中的缺点之间的差异,结果通常听起来不自然。

WaveNets通过生成新颖的语音来避免这个问题。

Voysis 在一年前的11月声称取得了突破,当时它发布了完全由算法产生的令人信服的令人信服的语音样本。“新一代语音技术将在此背后出现,”卡希尔当时告诉福布斯。

Cahill在学术界从事语音识别工作已有15年的时间,他创立了Voysis,目标是解决自然语言处理领域的特定领域,如电子商务和娱乐。其Voysis Commerce平台允许零售客户提供现有材料的数据库,包括为广告和产品页面编写的副本,以通知能够跟踪上下文的独特定制的语音模型。算法随着时间的推移而改进,可以在Voysis的云仪表板中通过单按按钮进行重新训练。

Voysis在其网站上写道:“默认情况下,所有内容都是可重现的,任务会自动重复数据删除,代码可以在数千台机器上扩展,而我们的科学家无需编写任何代码。” 除了可以集成到网站中的API和JavaScript库之外,其专有的语音识别和深度学习技术还可以以Android和iOS的软件开发工具包(SDK)的形式提供。

Voysis的大约15人团队分布在爱丁堡,苏格兰和波士顿的办事处,2017年增加了一倍多,达到40人,这得益于Polaris Partners的800万美元A系列资金。这家创业公司的负责人伊恩·霍德森(Ian Hodson) - 谷歌的文本转语音计划的前负责人,领导了谷歌地图,谷歌助手和Android等领域的核心团队。

这是一个利润丰厚的项目。根据Research and Markets的数据,预计到2022年,文本到语音应用市场将增长到30亿美元,同年数字助理的销售额可能会达到40亿美元。Google Home和Amazon Echo等智能扬声器的销售也在不断增长 - Adobe项目9月份的一项研究表明,到今年年底,美国大约一半的消费者将拥有一台具有语音识别功能的家用设备。

  • 发表于:
  • 原文链接https://venturebeat.com/2018/09/27/voysis-develops-offline-wavenet-voice-recognition-model-for-mobile-devices/
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券