谷歌公司开发出高速、离线语音识别技术

据科技资讯网站zdnet(www.zdnet.com)报道,谷歌开发出了可在未联网的Nexus 5智能手机上实时运行的语音识别系统。该系统无需通过远程数据中心进行运算,所以在没有可靠网络的情况下亦可通过智能手机、智能手表或其他内存有限的电子设备使用语音识别功能。

谷歌的科研人员表示,研发该系统的目的是创建在本地运行的轻量级、嵌入式、准确度高的语音识别系统。轻量级是指这套系统仅20.3MB,而在搭载2.26GHz CPU和2GB内存的Nexus 5上测试时,系统在开放式听写任务中的错误率仅为13.5%。

当然,就像谷歌近年来许多研究一样,这套系统也受到机器学习技术的支持——也就是“长短期记忆(LSTM)递归神经网络(RNN),使用链结式临时分类(CTC)和状态级最小贝叶斯风险(sMBR)技术进行训练”。为降低系统要求,研究人员为听写和语音命令这两个截然不同的语音识别领域开发了同一个模式。他们使用多种技术,将声学模型压缩为原版的十分之一大小。

研究人员表示,如果提出“发送电子邮件给Darnica Cumberland:我们可以改天吗?”这样的命令,离线内嵌式语音识别系统就可以即刻转录并于之后在后台执行。但准确的转录需要结合个人信息才能实现,例如联系人的姓名。研究人员表示,在模型中集成设备联系人列表即可解决这一问题。

为训练声学模型,研究人员从谷歌语音搜索流量中提取了三百万句语音,时长达2000小时。为了让模型更加稳定,他们还加入了来自YouTube视频的噪音样本。他们开发出的原版声学模型有80MB。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

七种基于云的机器学习服务

29040
来自专栏磐创AI技术团队的专栏

干货 | 史上最全中文分词工具整理

【磐创AI导读】:本文为中文分词工具整理分享。想要了解更多技术咨询,欢迎大家点击上方蓝字关注我们的公众号:磐创AI。

53930
来自专栏奇点大数据

入门深度学习应该学什么

最近被人问的最多的一个问题是“我想入门深度学习,我应该学些什么”。 老实说,这个问题不是那么好回答,毕竟每个人的知识背景和技能背景实在是太不一样了。如果要假设...

39570
来自专栏BestSDK

不只是PS,5款最好的安卓界面设计工具

1. Balsamiq 如果说要追求一种静态手绘文艺风格的产品线框图,Balsamiq绝对是一个优秀的选择。这款工具中所有的组件都是手绘风格,相信这种文艺气息会...

32630
来自专栏镁客网

黑科技 | 平面显微镜让失明者恢复视觉?莱斯大学推出可控制视觉系统

19970
来自专栏新智元

【AI VS人类】医生水平大PK: 人工智能四胜三平一负绝对领先

【新智元导读】IEEE Spectrum 日前公布了一个“记分牌”,显示了在医疗领域的各个子类中,AI 和人类医生谁更占优势,其中涵盖了心脏病、中风、自闭症、脑...

28160
来自专栏AI研习社

Tensorflow 1.0;TensorFlow 兼容 Spark;Python 迁移到 GitHub | AI 研习社周刊

【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿,邮件发送至:zhangxian@leiphone.com 2...

33240
来自专栏玉树芝兰

如何用Python做情感分析?

商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地。本文帮助你一步步用Python做出自己的情感分析结果,难道你不想试试看?

27320
来自专栏机器之心

前沿 | Science:自学习式人工智能可协助预测心脏病发作

选自Science 作者:Matthew Hutson 机器之心编译 参与:蒋思源、黄小天 近年来,将人工智能应用于医疗健康已经在蓬勃发展,机器之心也曾报道过医...

432120
来自专栏AI研习社

看过10万个视频 AI才能识别你的脑残操作 | 2分钟读论文

来源 / Two Minute Papers 翻译 / 朱婷 校对 / 李宇琛 整理 / 雷锋字幕组 AI 研习社出品系列短视频《 2 分钟论文 》,带大家用...

33350

扫码关注云+社区

领取腾讯云代金券