谷歌公司开发出高速、离线语音识别技术

据科技资讯网站zdnet(www.zdnet.com)报道,谷歌开发出了可在未联网的Nexus 5智能手机上实时运行的语音识别系统。该系统无需通过远程数据中心进行运算,所以在没有可靠网络的情况下亦可通过智能手机、智能手表或其他内存有限的电子设备使用语音识别功能。

谷歌的科研人员表示,研发该系统的目的是创建在本地运行的轻量级、嵌入式、准确度高的语音识别系统。轻量级是指这套系统仅20.3MB,而在搭载2.26GHz CPU和2GB内存的Nexus 5上测试时,系统在开放式听写任务中的错误率仅为13.5%。

当然,就像谷歌近年来许多研究一样,这套系统也受到机器学习技术的支持——也就是“长短期记忆(LSTM)递归神经网络(RNN),使用链结式临时分类(CTC)和状态级最小贝叶斯风险(sMBR)技术进行训练”。为降低系统要求,研究人员为听写和语音命令这两个截然不同的语音识别领域开发了同一个模式。他们使用多种技术,将声学模型压缩为原版的十分之一大小。

研究人员表示,如果提出“发送电子邮件给Darnica Cumberland:我们可以改天吗?”这样的命令,离线内嵌式语音识别系统就可以即刻转录并于之后在后台执行。但准确的转录需要结合个人信息才能实现,例如联系人的姓名。研究人员表示,在模型中集成设备联系人列表即可解决这一问题。

为训练声学模型,研究人员从谷歌语音搜索流量中提取了三百万句语音,时长达2000小时。为了让模型更加稳定,他们还加入了来自YouTube视频的噪音样本。他们开发出的原版声学模型有80MB。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

​AI大事件 | 人工智能检测自杀倾向,三星收购AI公司

1583
来自专栏大数据文摘

Elon Musk揭OpenAI研究新突破, 可在VR中自我学习的机器人(附论文)

1905
来自专栏量子位

通过照片内容搜图,Facebook这个新技能是如何实现的?

现在,你可以在Facebook上通过描述照片中的内容来搜索图片了:手工添加的图片标题和标签都不再重要。 这个功能的背后,是Facebook计算机视觉平台Lum...

29510
来自专栏ATYUN订阅号

Wildbook利用AI帮助保护濒临灭绝的野生动物

人们使用Facebook与朋友,家人联系,现在他们可以使用另一种“Facebook”,帮助野生动物研究人员和环保主义者密切关注濒临灭绝的动物。现在,Wildb...

886
来自专栏大数据文摘

重磅译制 | 更新:MIT 6.S094自动驾驶课程第2讲(3)动手项目DeepTraffic

1464
来自专栏大数据文摘

重磅译制 | 更新:MIT 6.S094自动驾驶课程第2讲(2)深度Q学习

1524
来自专栏企鹅号快讯

攻击生物识别验证,可以分哪几步?

刷脸乘车、刷脸支付、刷脸解锁手机......从钱包到手机,这一次干脆彻底解放。生活中似乎不会再有忘带现金、忘记密码的尴尬,因为没有人出门会忘记”带脸“。现实真魔...

1937
来自专栏大数据文摘

重磅译制 | 更新:牛津大学xDeepMind自然语言处理 第8讲(下)注意力模型

1296
来自专栏大数据文摘

资源 | 适合小朋友的Scratch动手项目!AI在生活中的19个应用

1614
来自专栏大数据文摘

科技网红Siraj最新油管视频:如何用4分钟搭建神经网络

1568

扫描关注云+社区