谷歌公司开发出高速、离线语音识别技术

据科技资讯网站zdnet(www.zdnet.com)报道,谷歌开发出了可在未联网的Nexus 5智能手机上实时运行的语音识别系统。该系统无需通过远程数据中心进行运算,所以在没有可靠网络的情况下亦可通过智能手机、智能手表或其他内存有限的电子设备使用语音识别功能。

谷歌的科研人员表示,研发该系统的目的是创建在本地运行的轻量级、嵌入式、准确度高的语音识别系统。轻量级是指这套系统仅20.3MB,而在搭载2.26GHz CPU和2GB内存的Nexus 5上测试时,系统在开放式听写任务中的错误率仅为13.5%。

当然,就像谷歌近年来许多研究一样,这套系统也受到机器学习技术的支持——也就是“长短期记忆(LSTM)递归神经网络(RNN),使用链结式临时分类(CTC)和状态级最小贝叶斯风险(sMBR)技术进行训练”。为降低系统要求,研究人员为听写和语音命令这两个截然不同的语音识别领域开发了同一个模式。他们使用多种技术,将声学模型压缩为原版的十分之一大小。

研究人员表示,如果提出“发送电子邮件给Darnica Cumberland:我们可以改天吗?”这样的命令,离线内嵌式语音识别系统就可以即刻转录并于之后在后台执行。但准确的转录需要结合个人信息才能实现,例如联系人的姓名。研究人员表示,在模型中集成设备联系人列表即可解决这一问题。

为训练声学模型,研究人员从谷歌语音搜索流量中提取了三百万句语音,时长达2000小时。为了让模型更加稳定,他们还加入了来自YouTube视频的噪音样本。他们开发出的原版声学模型有80MB。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏奇点大数据

最前沿:从虚拟到现实,DRL 让小狗机器人跑起来了

深度增强学习 DRL 在仿真机器人已经取得了很大的成功,同时,也在真实的机器人抓取(Robotic Manipulation)问题上有了很大的进展。然而依然会有...

483
来自专栏人工智能头条

资源 | Python数据分析课程:从入门到实战

1893
来自专栏量子位

百度让AI像婴儿一样学语言,还能举一反三听老师指挥走迷宫

李杉 李林 编译整理 量子位 出品 | 公众号 QbitAI 把已经学会的技能用在新的任务上,对于人类来说是很简单的事,但这种“泛化”能力是机器所缺乏的。 百度...

3168
来自专栏腾讯高校合作

2015年度CCF-腾讯犀牛鸟基金文智中文语义开放平台

文智中文语义开放平台。 腾讯搜索技术团队为需要做大数据挖掘和文本处理的研究者们提供有效的工具平台——文智中文语义开放平台。该平台能够满足研究者自然语言处理、文本...

32511
来自专栏ATYUN订阅号

Fast.ai发布Fastai 1.0完整版本,用于PyTorch的免费、开源深度学习库

Fast.ai宣布推出Fastai 1.0完整版本,这是一个运行在Facebook的PyTorch框架之上的免费、开源深度学习库。

1072
来自专栏星回的实验室

推荐系统从0到1[一]:数据与画像

年终了,终于可以在需求的夹缝中喘息一会。回望2017年,最大的成就莫过于从0到1搭建起了一套支持多业务场景、高并发访问、高时效性的新闻推荐系统。这其中自是暗坑无...

1222
来自专栏人工智能头条

七种基于云的机器学习服务

1814
来自专栏新智元

【干货】4月Python 热门推荐Top 10

1364
来自专栏CreateAMind

her训练效果,可以准备人机乒乓球比赛了

892
来自专栏量子位

想降低云服务的花销?或许深度强化学习能帮到你 | 论文

安妮 编译自 arXiv 量子位 出品 | 公众号 QbitAI 随着云计算的普遍应用,控制计算成本越来越重要,但有调查显示,30%-45%的云开销被浪费了。一...

3485

扫码关注云+社区