业界 | 百度推出 AI 转录应用 SwiftScribe,由 DeepSpeech 2加持

AI科技评论消息,百度硅谷研究院于 3 月 14 日推出了一款基于人工智能的转录应用 SwiftScribe。

根据 SVAIL 的官网消息,AI科技评论了解到,SwiftScribe 基于百度于 2015 年年底推出的语音识别产品 Deep Speech2,其神经网络通过输入数千小时的标记音频数据,从中学习特定的单词与词组。

用户目前在转录过程中面临的最大问题在于不连续性(discontinuity),针对这一问题,除了 ASR 技术外,百度团队在快捷键与人机交互方面进行创新。

「通过百度最先进的语音识别技术与灵活的编辑工具,SwiftScribe 能够帮助人们快速轻松地转录语音记录,提升生产力并简化工作流程。」

而这也是百度 SVAIL 所大力推崇的优势所在:在用户转录及编辑的过程中,系统能够从人身上「偷师」,并以此提升自己的转录水平。「这样的端到端训练让 SwiftScribe 得以区别于目前市面上的其它产品。」

如果想要精确度更高的转录效果,一小时的音频需要花费 4-6 小时进行转录,每分钟收费一美元,而采用 SwiftScribe,将会缩短 40% 的转录时间。

百度推出 SwiftScribe 主要面向经常需要使用转录功能的企业及个人,甚于它的使用广泛性,SwiftScribe认为能够让一大批用户受益,包括医学健康、法律部门、商业媒体等领域。

目前百度开放了 30-50 个测试名额,具体可参看 http://swiftscribe.ai/ 或发邮件到 swiftscribe@baidu.com 了解。

既然是基于 Deep Speech 而构建的转录系统,让我们和AI科技评论一同简单回顾下百度的语音识别研发历程:

  • 在2014年底,百度团队发布了第一代深度语音识别系统Deep Speech,系统采用了端对端的深度学习技术,当时实现了提高嘈杂环境下的英语识别准确率,实验显示比谷歌、微软及苹果的语音系统的出错率要低10%。
  • 而在2015年8月,百度研究院新增了汉语的识别,准确率高达94%。这也让端到端的深度学习算法成为语音识别提升最重要的手段之一。
  • 9月份的百度世界大会上,吴恩达也在期间展示了新一代的百度语音识别技术,验证在较为嘈杂的情况下,机器识别已经超过人类。
  • 2015年年底,百度研究院又发布了论文推出Deep Speech2,它能够通过深度学习网络识别嘈杂环境下的不同语言,所应用的HPC技术将识别速度提升了7倍。
  • 根据研究院的官方消息,HPC技术目前已在今年2月成功应用于深度学习中。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

百度沈国龙:BML百度大规模机器学习云平台实践

1688
来自专栏人工智能快报

DeepMind利用人工神经网络打造“类脑导航系统”

谷歌旗下的DeepMind公司在《自然》杂志发文表示,该公司构建了可模拟人类大脑“定位细胞”的人工神经网络。

772
来自专栏人工智能头条

AAAI主席Rao Kambhampati:破解人机共存的规划技术挑战(PPT下载)

1173
来自专栏AI科技评论

洞见 | 专访中科创达王璠:怎样做好嵌入式人工智能的算法开发?

目前在人工智能领域,不管是学术圈还是工业圈,大家都认同一个趋势,那就是在很多应用场景上计算需要落地到设备上,让设备拥有智能化——即嵌入式的AI,这个是人工智能领...

3519
来自专栏吉浦迅科技

吴恩达:人工智能现在可以做什么和不能做什么?

许多管理人员问我人工智能可以做什么。 他们想知道它将如何破坏他们的行业,以及他们如何使用它来重塑自己的公司。 但最近媒体会不切实际地夸大AI的力量 (也许很快它...

40520
来自专栏机器学习算法与Python学习

人工智能让人人都有智能伴侣-----吴恩达---百度

以下为演讲实录: 吴恩达:谢谢,大家好,人工智能已经在世界有很大的影响力,百度是引领人工智能发展的公司之一,今天我想跟大家分享一些我们正在做的先进技术,我也...

3223
来自专栏罗超频道

多媒体搜索再进化

2015年百度世界展出了语音和图像为代表的多媒体搜索技术,这并非其首次亮相百度世界大会,多媒体搜索已成为百度的重头戏,与连接人与服务战略、人工智能战略一起构成百...

3348
来自专栏机器之心

Google I/O 李飞飞等四领域女性专家,谈机器学习的过去、现在和未来

机器之心原创 作者:李亚洲、李泽南、虞喵喵 在 Google I/O 首日的 Keynote 中,Google 公布了一系列新的硬件、应用和基础研究。自去年提出...

35110
来自专栏CDA数据分析师

机器学习的商业应用

机器学习的商业应用就是把真实的场景,真实的商业应用的经验凝练成对每个数据分析师都有价值的功能,逐渐放到产品中。 本期精编版嘉宾演讲为IBM中国开发中心技术总监...

1925
来自专栏CDA数据分析师

吴恩达 | AI是新的电力 | 演讲稿全文整理(附视频中字)

在上周O’reilly举办的AI Conference上,吴恩达进行了主题为“AI是新的电力”长达25分钟的演讲,演讲中吴恩达亲自板书,内容也是干货满满了。 在...

2275

扫码关注云+社区