高通研究新进展,设备离线语音识别率高达95%

AiTechYun

编辑:chux

在波士顿的Re-Work深度学习峰会上,高通公司的人工智能研究员Chris Lott介绍了他的团队在新的语音识别程序方面的工作。

该系统在智能手机或其他便携式设备上进行本地工作,包括两种神经网络:使用其内部状态或存储器处理输入的递归神经网络(RNN),以及卷积神经网络,这种神经网络模仿人脑中神经元之间的连接模式。Lott说,平均来说,识别单词和短语的概率高达95%。

“它从使用设备的模式中学习,”他说。“它可以个性化行为。”

Lott解释说,目前大多数语音识别系统都在云中处理语音识别。手机中的麦克风和芯片,谷歌家庭和亚马逊Echo扬声器等智能家庭扬声器,以及带有微软Cortana助手的Windows电脑都可以听到一连串的声音命令,但是它们不会分析这些命令,而是将繁琐的工作转移到运行复杂机器学习算法的强大远程服务器上。

对于一些用户来说,将他们的语音数据交给云端会引发隐私问题。亚马逊的Alexa助手和Google智能助理都会在将它们发送给他们进行分析之前记录片段,并且他们保留这些语音片段,直到用户选择删除它们。两家公司都表示他们使用录音来改善他们的服务并提供更多个性化的回应。

但在某些情况下,录音并不保密。2016年,亚利桑那州侦探谋杀案的侦探寻求获取亚马逊Echo演讲者的语音数据,该数据最终得到了被告的许可。

Lott说,除了保护隐私之外,设备上的语音处理还有其他优势。因为它不需要将数据上传到云端,所以它立即响应命令,并且因为它不需要互联网连接,所以这种方式更可靠。

他说:“这是一种以某种神经网络来完成整个端到端系统的方法,这会让设备更自然地进行交互。”

2016年,Google 创建了离线语音识别系统,该系统比当时的在线系统快7倍。该模型经过约2000小时的语音数据训练,尺寸为20.3兆字节,在智能手机上的准确率达到86.5%。

当然,设备离线语音识别有其自身的一些限制。设计为脱机工作的算法无法连接到互联网来搜索问题的答案,并且错过在基于云的系统中通过更大且更多不同数据集进行改进。

但Lott认为高通的解决方案是前进的方向。“云固然很强大,但我们认为语音识别应该直接在设备上实现。”

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-05-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

观点 | 除了学位证书,如何证明自己的深度学习实力?

选自fast.ai 作者:Rachel Thomas 机器之心编译 参与:蒋思源、晏奇 不是研究生,不是相关专业的我们又该怎样证明自己的深度学习技能?也许很多读...

32160
来自专栏专知

【前沿】人工智能系统的四大趋势与九大挑战,美国Berkeley14位重量级学者(包含机器学习泰斗Jordan)最新观点

【导读】最近,加州大学伯克利分校大学的大牛们针对目前AI的火爆形势,又总结了一篇《A Berkeley View of Systems Challenges f...

1.2K60
来自专栏数据猿

金融科技&大数据产品推荐:星环人工智能平台

Transwarp Sophon是一款通用的人工智能平台,帮助企业级用户快速实现人工智能的落地。对于大多数企业用户而言,要通过自己的力量从无到有打造人工智能平台...

44050
来自专栏SDNLAB

应用驱动网络(ADN)开启用户体验新时代

未来网络的核心挑战是如何解决网络架构制约商业模型创新的问题。 运营商的收益依赖于用户规模,用户增长面临瓶颈。互联网最初架构的思想就是为了流量而建网,并不考虑不...

42990
来自专栏PPV课数据科学社区

【技术】大数据关键技术

大数据技术,就是从各种类型的数据中快速获得有价值信息的技术。大数据领域已经涌现出了大量新的技术,它们成为大数据采集、存储、处理和呈现的有力武器。 ...

37440
来自专栏人工智能头条

去苹果做 AI 一共分几步?看看这套面试指南吧(附面试题)

24220
来自专栏机器之心

专访 | 腾讯云机器学习平台技术负责人黄明,详解 DI-X 深度学习平台

机器之心原创 作者:高静宜 3 月 28 日,腾讯云宣布推出深度学习平台 DI-X(Data Intelligence X),为机器学习、深度学习用户提供一站式...

63590
来自专栏数据之美

用户画像从入门到挖坑

背景 用户流量从搜索引擎为入口的增量时代到移动互联网普及人口红利不再的存量时代,这个变化对每个公司的获客成本,运营思路都产生了很大的影响,在流量日益枯竭,获客成...

1.9K90
来自专栏华章科技

业余时间学数据分析,如何快速上手

广泛被应用的数据分析:谷歌的数据分析可以预测一个地区即将爆发的流感,从而进行针对性的预防;淘宝可以根据你浏览和消费的数据进行分析,为你精准推荐商品;口碑极好的网...

16040
来自专栏EAWorld

【超详解PPT】元数据驱动的微服务架构(上)

? 各位好!很高兴能与大家分享“元数据驱动的微服务架构”。 ? 本次分享有两个部分:1、微服务架构需要元数据,2、介绍微服务与元数据的关系。下期会分享:微服务...

66870

扫码关注云+社区

领取腾讯云代金券