高通称其终端语音识别准确率达95%

高通公司人工智能研究人员表示,该公司正在研制用于智能终端的语音识别系统,通过综合采用循环神经网络和卷积神经网络,该系统语音识别准确率可达95%。

在波士顿举行的Re-Work深度学习峰会上,高通公司的人工智能研究员Chris Lott介绍了他的团队在一个新语音识别程序方面的工作。

该系统工作于智能手机或其他便携式设备上,由两种神经网络组成:利用内部状态或存储器处理输入的递归神经网络(RNN),以及模拟人脑神经元之间连接模式的卷积神经网络。Lott表示,平均来说,它能够识别95%的单词和短语。他说:“它能够从模式中学习,也能够从你的使用过程中学习。它可以根据你而改变行为。”

Lott解释说,目前大多数语音识别系统都在云中完成大部分处理任务。手机中的麦克风和芯片、类似于谷歌Home和亚马逊Echo的智能家庭扬声器,以及带有微软Cortana助手的Windows电脑都能够听懂诸如“OK Google”和“Hey Cortana”这样的“热门词汇”。这些词汇能够使系统准备好接受随后的语音命令,但系统不会分析这些命令—它们将繁琐的工作转移到运行复杂的机器学习算法的强大远程服务器上。

对一些用户来说,将他们的语音数据交给云端会引发隐私问题。在将这些数据发送出去进行分析之前,亚马逊的Alexa助手和Google智能助理都会记录语音片段,并保留这些语音片段,直到用户选择删除它们。两家公司都表示他们将录音用于改善他们的服务,并提供更多个性化的回应。

但在某些情况下,录音并不能保密。2016年,在美国亚利桑那州调查一起谋杀案的侦探们试图从亚马逊Echo演讲者获得语音数据。在被告的同意下,该数据最终被获得。

Lott说,除了能够保护隐私之外,设备上的语音处理还有其他好处。因为它不需要将数据上传到云端,所以能够立即响应命令,而且因为它不需要互联网连接,所以更加可靠。他说:“有人试图以神经网络的方式完成整个端到端系统。这会让人与设备更自然地进行交互。”

Lott的话是有根据的。2016年,Google创建了离线语音识别系统,该系统当时比在线系统快7倍。该模型经过约2000小时的语音数据训练后,大小为20.3兆,在智能手机上的识别准确率达到了86.5%。

当然,设备上的语音识别也有其自身的一些限制。设计为脱机工作的算法无法连接到互联网来搜索问题的答案,并且它们无法在具有更大、更多不同数据集的基于云的系统中实现改进。

但Lott认为高通的解决方案是前进的方向。“云端发生了很多事情,但我们认为它应该直接发生在设备上。”

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2018-06-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

来自Google的经验:以用户为中心的机器学习七大技巧

10620
来自专栏ATYUN订阅号

高通研究新进展,设备离线语音识别率高达95%

在波士顿的Re-Work深度学习峰会上,高通公司的人工智能研究员Chris Lott介绍了他的团队在新的语音识别程序方面的工作。

17940
来自专栏人工智能头条

基于腾讯信鸽平台的手游流失用户预测模型概览

252100
来自专栏媒矿工厂

广播电视拥抱人工智能

最近几年人工智能(AI)领域出现了许多令人惊叹的发展。尽管如此,AI仍然是一个容易被炒作和误解的术语。

44750
来自专栏数据之美

用户画像从入门到挖坑

背景 用户流量从搜索引擎为入口的增量时代到移动互联网普及人口红利不再的存量时代,这个变化对每个公司的获客成本,运营思路都产生了很大的影响,在流量日益枯竭,获客成...

1.8K90

“机器学习”自学手册

在自学“机器学习”方面,你能做的事其实很多。你可以参考一些书籍或者相关的课程、参加一些竞赛,或者使用一些你能用到的相关的工具等等。在本文中,我将结构性的阐述一下...

215110
来自专栏量子位

亚马逊全面发力AI,推机器学习托管服务、四项新工具,还有AI硬件

Root 假装发自 拉斯维加斯 量子位 出品 | 公众号 QbitAI 机器学习现在已经在多个领域爆发出惊人的能量,企业通过获取有效的用户数据,可以高效锁定用户...

31570
来自专栏新智元

【比竞争对手快3倍】微软官方发布CNTK 2.0,增加 Python 和 Keras 支持

【新智元导读】微软今天发布了深度学习工具包CNTK的2.0版本,新版本增加了支持 Keras 的 CNTK 后端,Java API,模型评估的 Spark 支持...

43780
来自专栏大数据挖掘DT机器学习

在线学习行为分析建模及挖掘

在日趋精密数字技术条件下,学习模式已通过互联网、社会化媒体实现数字化。海量的学习信息以数据的形式蕴含着学习者的隐性行为特征。文章从数据挖掘与领域应用...

70660
来自专栏ThoughtWorks

数据质量管理的一些思考

在近期的项目当中,我们为客户落地实施了数据资产平台。随后,在数据平台中接入了客户子公司的一个业务系统的明细数据。客户希望在我们的数据平台上通过数据探索和数据分析...

41340

扫码关注云+社区

领取腾讯云代金券