业界 | 百度推出 AI 转录应用 SwiftScribe,由 DeepSpeech 2加持

AI科技评论消息,百度硅谷研究院于 3 月 14 日推出了一款基于人工智能的转录应用 SwiftScribe。

根据 SVAIL 的官网消息,AI科技评论了解到,SwiftScribe 基于百度于 2015 年年底推出的语音识别产品 Deep Speech2,其神经网络通过输入数千小时的标记音频数据,从中学习特定的单词与词组。

用户目前在转录过程中面临的最大问题在于不连续性(discontinuity),针对这一问题,除了 ASR 技术外,百度团队在快捷键与人机交互方面进行创新。

「通过百度最先进的语音识别技术与灵活的编辑工具,SwiftScribe 能够帮助人们快速轻松地转录语音记录,提升生产力并简化工作流程。」

而这也是百度 SVAIL 所大力推崇的优势所在:在用户转录及编辑的过程中,系统能够从人身上「偷师」,并以此提升自己的转录水平。「这样的端到端训练让 SwiftScribe 得以区别于目前市面上的其它产品。」

如果想要精确度更高的转录效果,一小时的音频需要花费 4-6 小时进行转录,每分钟收费一美元,而采用 SwiftScribe,将会缩短 40% 的转录时间。

百度推出 SwiftScribe 主要面向经常需要使用转录功能的企业及个人,甚于它的使用广泛性,SwiftScribe认为能够让一大批用户受益,包括医学健康、法律部门、商业媒体等领域。

目前百度开放了 30-50 个测试名额,具体可参看 http://swiftscribe.ai/ 或发邮件到 swiftscribe@baidu.com 了解。

既然是基于 Deep Speech 而构建的转录系统,让我们和AI科技评论一同简单回顾下百度的语音识别研发历程:

  • 在2014年底,百度团队发布了第一代深度语音识别系统Deep Speech,系统采用了端对端的深度学习技术,当时实现了提高嘈杂环境下的英语识别准确率,实验显示比谷歌、微软及苹果的语音系统的出错率要低10%。
  • 而在2015年8月,百度研究院新增了汉语的识别,准确率高达94%。这也让端到端的深度学习算法成为语音识别提升最重要的手段之一。
  • 9月份的百度世界大会上,吴恩达也在期间展示了新一代的百度语音识别技术,验证在较为嘈杂的情况下,机器识别已经超过人类。
  • 2015年年底,百度研究院又发布了论文推出Deep Speech2,它能够通过深度学习网络识别嘈杂环境下的不同语言,所应用的HPC技术将识别速度提升了7倍。
  • 根据研究院的官方消息,HPC技术目前已在今年2月成功应用于深度学习中。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【Nature】AlphaGo赢了围棋,但玩量子计算游戏人的直觉强过机器

? Quantum Moves游戏过程 来源:nature.com 【新智元导读】Nature日前刊发论文,丹麦奥胡斯大学的科学家设计了一款量子计算游戏,...

34810
来自专栏灯塔大数据

基于数据分析的产品思维模式

数据分析( Data Analysis )——这个词真的是如雷贯耳,装B一绝啊!甭管什么玩意,上来先整一通再说。“数据分析”甚是被提上了神坛,找工作或者聊点行业...

2774
来自专栏PPV课数据科学社区

数据分析师?程序能做的事还需要你吗?

数据分析在现实中,当一个数据分析师跟别人聊天的时候,经常会被问一些问题: Q:数据分析人员能做什么? A:从纷繁的数据里提炼出有价值的信息并给公司提供支持啊。...

3449
来自专栏PPV课数据科学社区

【聚焦】拍案而起,十问大数据

 在互联网时代,大数据炙手可热,许多人言必称大数据,但能够真正说清大数据为何物的人并不多,更遑论如何借助大数据挖掘出巨大的商业价值。究竟如何定义大数据?大数据...

3576
来自专栏新智元

【重磅】谷歌人工智能帝国内幕大起底

【新智元导读】今天谷歌CEO在年度公开信中写道,我们将进入人工智能为先的世界,但并没有透露多少细节。本文详尽梳理了谷歌所有的——没错,是所有的——人工智能项目及...

37111
来自专栏腾讯大讲堂的专栏

干货 | 滴滴出行大区运营经理:滴滴的城市运营方法论

讲师介绍:刘武新,滴滴出行出租车事业部广州大区运营经理,曾经就职为顺丰速运集团,中国移动,中兴软创科技等公司的数据分析师、项目经理、运营经理等岗位,6+年以上数...

5877
来自专栏腾讯研究院的专栏

智能监控面临更大挑战 大数据处理需改善

在智慧城市、平安城市大的发展潮流下,人们对于自己居住的环境要求也逐渐提升,不少消费者开始关注家庭级安防产品,一方面是应对用户日渐苛刻的需求,而另一方面也是减少...

3688
来自专栏互联网数据官iCDO

对混乱的市场营销技术的整合模型推荐

译者:Julie Zhou 审校:Nic 本文长度为1477字,预估阅读时间5分钟。 摘要:很多市场从业者对于各种营销技术感到困惑,他们通常不清楚应该怎样对解...

2646
来自专栏华章科技

掌握8项技能让你顺利受雇于4种逼格最高的数据科学岗位

你想找到一份数据科学家的工作吗?如果你有这样的想法的话,那么你就有伴儿了。最近由Thomas Davenport和D.J. Patil在《哈佛商业周刊》上面发表...

391
来自专栏PPV课数据科学社区

如何区分理解数据科学家与机器学习工程师

数据科学家Vs机器学习工程师 原文: What are machine learning engineers来源: https://tech.co/12-way...

2779

扫码关注云+社区