AI科技评论消息,百度硅谷研究院于 3 月 14 日推出了一款基于人工智能的转录应用 SwiftScribe。
根据 SVAIL 的官网消息,AI科技评论了解到,SwiftScribe 基于百度于 2015 年年底推出的语音识别产品 Deep Speech2,其神经网络通过输入数千小时的标记音频数据,从中学习特定的单词与词组。
用户目前在转录过程中面临的最大问题在于不连续性(discontinuity),针对这一问题,除了 ASR 技术外,百度团队在快捷键与人机交互方面进行创新。
「通过百度最先进的语音识别技术与灵活的编辑工具,SwiftScribe 能够帮助人们快速轻松地转录语音记录,提升生产力并简化工作流程。」
而这也是百度 SVAIL 所大力推崇的优势所在:在用户转录及编辑的过程中,系统能够从人身上「偷师」,并以此提升自己的转录水平。「这样的端到端训练让 SwiftScribe 得以区别于目前市面上的其它产品。」
如果想要精确度更高的转录效果,一小时的音频需要花费 4-6 小时进行转录,每分钟收费一美元,而采用 SwiftScribe,将会缩短 40% 的转录时间。
百度推出 SwiftScribe 主要面向经常需要使用转录功能的企业及个人,甚于它的使用广泛性,SwiftScribe认为能够让一大批用户受益,包括医学健康、法律部门、商业媒体等领域。
目前百度开放了 30-50 个测试名额,具体可参看 http://swiftscribe.ai/ 或发邮件到 swiftscribe@baidu.com 了解。
既然是基于 Deep Speech 而构建的转录系统,让我们和AI科技评论一同简单回顾下百度的语音识别研发历程: