语音识别取得了两个里程碑进展 Mozilla发布开源语音识别模型和语音数据集

技术的进步推动了语音界面的发展,通过机器学习工具的普及,使得更多的互联网连接产品能够比以往任何时候都更能倾听和回应我们的声音。许多人将会体验到新的语音设备带来的便利。

Mozilla(缩写MF或MoFo)全称Mozilla基金会,是为支持和领导开源的Mozilla项目而设立的一个非营利组织。Mozilla对语音识别的潜力感到兴奋。他们相信这项技术能够并且将会带来一波创新产品和服务的浪潮,并且应该对所有人开放。

  • 更多信息:https://blog.mozilla.org/blog/2017/07/28/machine-learning-speech-recognition/

上个月29日,Mozilla的机器学习小组的语音识别工作取得了两个重要的里程碑进展。其中之一是Mozilla的开源语音识别模型首次发布,该模型的准确性接近人类在听同样的录音时的感知。其次,Mozilla还发布了世界上第二大公开的语音数据集,这是全球近2万名用户的贡献。

一个接近用户期望性能的开放源码的语音文本引擎 目前只有少数几家大公司的商业质量语音识别服务是可行的。这就减少了用户的选择,也减少了初创公司、研究人员甚至更大的公司的可用功能,这些公司想要为他们的产品和服务提供支持。

这就是为什么Mozilla将DeepSpeech作为一个开放源码项目。Mozilla和一群志同道合的开发人员、公司和研究人员组成的社区一起,应用了复杂的机器学习技术和各种各样的创新,在LibriSpeech的测试数据集上构建了一个语音到文本的引擎,出错率仅为6.5%。

  • DeepSpeech项目地址:https://github.com/mozilla/DeepSpeech

在发布的第一个版本中,引擎包含了Python、NodeJS和一个命令行二进制代码的预构建包,开发者可以马上使用它来进行语音识别。

构建世界上最多样化的公开语音数据集,为训练语音技术最优化 如此少的服务在商业上可用的一个原因是缺乏数据。创业公司、研究人员或任何想要建立语音技术的人都需要高质量的、转录的语音数据来训练机器学习算法。现在,他们只能访问相当有限的数据集。

为了解决这一障碍,Mozilla在今年7月启动了Common Voice项目。目标是让人们可以很容易地把他们的声音捐赠给一个公开的数据库,这样就可以建立一个语音数据集,每个人都可以用它来训练新的语音应用程序。

  • Common Voice项目:https://voice.mozilla.org/

到目前为止,Mozilla已经发布了第一批捐赠者的声音:近40万种录音,相当于500小时的演讲。任何人都可以下载这些数据。

  • 下载地址:https://voice.mozilla.org/data

Mozilla收到了来自全球范围内的2万多人提供的不同的声音。通常,现有的语音识别服务无法理解不同的口音,而且大多数情况,比起女性更善于理解男性的语音——这是语音识别服务接受训练的数据中存在的偏见结果。Mozilla希望说话者的数量和他们的不同的口音能够创造出一个全球性的代表数据集,从而带来更具包容性的技术。

为此,Mozilla开始使用英语,并且正在努力确保从2018年上半年开始,Common Voice项目能够支持多种语言的语音捐赠。最后,当经历了寻找可公开的语音数据集的挑战时,Mozilla还收集了所有其他我们所知道的大型语音收集的链接。

Mozilla认为,技术应该是开放的,所有人都可以访问,包括语音。Mozilla开发这种技术的方法是由设计开放的,他们非常欢迎更多的合作者和贡献者与之一起工作。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2017-12-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

Common Voice开源语音识别数据集项目范围再扩大,开始建立多语言数据集

Common Voice项目旨在创建开源语音识别数据集,Mozilla宣布它正在扩大此众包项目,以加入更多语言。

1083
来自专栏灯塔大数据

基于数据分析的产品思维模式

数据分析( Data Analysis )——这个词真的是如雷贯耳,装B一绝啊!甭管什么玩意,上来先整一通再说。“数据分析”甚是被提上了神坛,找工作或者聊点行业...

2654
来自专栏镁客网

玩VR游戏头晕不要怕!哥伦比亚大学新研究带你飞

972
来自专栏量子位

华为AI战略完整披露!2款AI芯片首次曝光,拳打TPU,争锋英伟达

2018华为全连接大会上,华为轮值董事长徐直军一口气高密度发布:华为AI战略、华为AI全栈全场景解决方案、华为自研统一达芬奇架构的2款AI芯片……

592
来自专栏企鹅号快讯

让工业智能接地气的那些事儿

提到工业智能,总绕不开“大数据”、“云计算”、“人工智能”这样几个关键词。其实还有一个关键词也非常重要,它能够将上述几个关键词穿连起来,让工业智能可以真正实现落...

1888
来自专栏CDA数据分析师

避开机器学习中的陷阱 数据比算法更重要

用户行为分析、网络威胁检测,一股新的浪潮正在持续发酵。安全数据分析被用于掌握情况、发现问题和预测风险,并带来了潜力不可限量的营销前景。理想的情况是从攻击中提取出...

1836
来自专栏大数据文摘

大数据独角兽Palantir之核心技术探秘

1387
来自专栏PPV课数据科学社区

【学习】大数据技术学习路线指南:[2]实践原型

大数据的目的在于挖掘价值,而它的本质与OODA循环决策模型非常相似。用OODA这个原型来理解大数据是最合适的了!在战场上,OODA循环决策的周期越短,胜算越大;...

3516
来自专栏DT数据侠

Adidas、金拱门、KFC、乐天玛特,零售巨头的选址秘诀都在数据里了

在当前复杂的零售环境下,选址对于零售企业而言变得格外重要,因为位置就是线下流量的直接入口。近期数据侠实验室,DT君邀请到了GeoHey·极海上海分公司的技术总监...

640
来自专栏PPV课数据科学社区

网络大数据的统计和分析利用

大数据给互联网带来的是空前的信息大爆炸,它不仅改变了互联网的数据应用模式,还将深深影响着人们的生产生活。深处在大数据时代中,人们认识到大数据已经将数据分析的认识...

2705

扫码关注云+社区