前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >高通称其终端语音识别准确率达95%

高通称其终端语音识别准确率达95%

作者头像
人工智能快报
发布2018-07-26 16:34:22
5170
发布2018-07-26 16:34:22
举报
文章被收录于专栏:人工智能快报人工智能快报

高通公司人工智能研究人员表示,该公司正在研制用于智能终端的语音识别系统,通过综合采用循环神经网络和卷积神经网络,该系统语音识别准确率可达95%。

在波士顿举行的Re-Work深度学习峰会上,高通公司的人工智能研究员Chris Lott介绍了他的团队在一个新语音识别程序方面的工作。

该系统工作于智能手机或其他便携式设备上,由两种神经网络组成:利用内部状态或存储器处理输入的递归神经网络(RNN),以及模拟人脑神经元之间连接模式的卷积神经网络。Lott表示,平均来说,它能够识别95%的单词和短语。他说:“它能够从模式中学习,也能够从你的使用过程中学习。它可以根据你而改变行为。”

Lott解释说,目前大多数语音识别系统都在云中完成大部分处理任务。手机中的麦克风和芯片、类似于谷歌Home和亚马逊Echo的智能家庭扬声器,以及带有微软Cortana助手的Windows电脑都能够听懂诸如“OK Google”和“Hey Cortana”这样的“热门词汇”。这些词汇能够使系统准备好接受随后的语音命令,但系统不会分析这些命令—它们将繁琐的工作转移到运行复杂的机器学习算法的强大远程服务器上。

对一些用户来说,将他们的语音数据交给云端会引发隐私问题。在将这些数据发送出去进行分析之前,亚马逊的Alexa助手和Google智能助理都会记录语音片段,并保留这些语音片段,直到用户选择删除它们。两家公司都表示他们将录音用于改善他们的服务,并提供更多个性化的回应。

但在某些情况下,录音并不能保密。2016年,在美国亚利桑那州调查一起谋杀案的侦探们试图从亚马逊Echo演讲者获得语音数据。在被告的同意下,该数据最终被获得。

Lott说,除了能够保护隐私之外,设备上的语音处理还有其他好处。因为它不需要将数据上传到云端,所以能够立即响应命令,而且因为它不需要互联网连接,所以更加可靠。他说:“有人试图以神经网络的方式完成整个端到端系统。这会让人与设备更自然地进行交互。”

Lott的话是有根据的。2016年,Google创建了离线语音识别系统,该系统当时比在线系统快7倍。该模型经过约2000小时的语音数据训练后,大小为20.3兆,在智能手机上的识别准确率达到了86.5%。

当然,设备上的语音识别也有其自身的一些限制。设计为脱机工作的算法无法连接到互联网来搜索问题的答案,并且它们无法在具有更大、更多不同数据集的基于云的系统中实现改进。

但Lott认为高通的解决方案是前进的方向。“云端发生了很多事情,但我们认为它应该直接发生在设备上。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能快报 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档