Mozilla开源语音识别模型和世界第二大语音数据集

原标题:资源 | Mozilla开源语音识别模型和世界第二大语音数据集

选自Mozilla

机器之心编译

参与:刘晓坤

Mozilla 对语音识别的潜能抱有很大期望,但这一领域目前仍然存在对创新的明显阻碍,这些挑战激发这家公司启动了 DeepSpeech 项目和 Common Voice 项目。近日,他们首次发布了开源语音识别模型,其拥有很高的识别准确率。与此同时,这家公司还发布了世界上第二大的公开语音数据集,该数据集由全球将近 20000 人所贡献。

开源语音识别模型:https://hacks.mozilla.org/2017/11/a-journey-to-10-word-error-rate/

公开语音数据集:https://medium.com/mozilla-open-innovation/sharing-our-common-

DeepSpeech:一个开源的语音到文本的转换引擎,可以达到用户期待的高性能

目前市场上只有少量可用的商业性质的语音识别服务,且被少数几个大公司占据。这限制了初创公司、研究者,甚至那些希望在产品和服务中引入语音功能的大型公司的用户选择和可选特性。

这也是 Mozilla 启动并将 DeepSpeech 作为开源项目的初衷。和一群志同道合的开发者、公司和研究者一起,该公司通过应用复杂的机器学习技术,并开发多项新技术建立了一个语音到文本的转换引擎,它在 LibrSpeech 的 test-clean 数据集上仅有 6.5% 的词错率。

DeepSpeech 项目链接:https://github.com/mozilla/DeepSpeech

Mozilla 首次发布的 DeepSpeech 产品中包括了预构建的 Python 包、NodeJS 包和一个命令行二进制,从而使开发者可以立刻使用并进行语音识别实验。

Common Voice:建立世界上种类最多的公开语音数据集,以及开发最优化的语音训练技术

本文来自企鹅号 - 凤凰网媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

数据科学求职丨简历中应避免的四个错误

通过了解数百家公司在招聘过程,我们了解到哪些简历是公司所青睐的,以及哪些简历是会被否决。

17310
来自专栏机器之心

资源 | Mozilla开源语音识别模型和世界第二大语音数据集

47480
来自专栏新智元

【开源之战】在搜集人类语音数据上,谷歌与火狐展开正面交锋

【新智元导读】巨头都在争相开源,那么彼此之间会不会形成竞争?近日,火狐浏览器的所有者 Mozilla 开源了一个语音数据库,与谷歌所做的数据库高度类似。这篇文章...

30530
来自专栏机器之心

Python扩大领先优势,PyTorch仅占6.4%:2018年数据科学语言&工具排名

14660

机器学习自学指南

你有许多方法和资源来学习机器学习:阅读书籍、学习课程、参加比赛和各种可用的工具。在这篇文章中,我想使这些活动更为体系化,并列出一个大致的顺序,以说明在普通程序员...

29480
来自专栏大数据文摘

学界 | 视频卡到天荒地老?MIT最新算法Pensieve让你观影畅通无阻

17020
来自专栏数据库

论道数据仓库维度建模和关系建模

为什么要数据仓库建模呢? 如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作...

39770
来自专栏数据科学与人工智能

知识图谱的应用

导读 知识图谱 (Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各...

1.3K80
来自专栏机器学习算法与Python学习

为什么程序员一定要学深度学习

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 对于深度学习,我也是一个初学者,能力...

35340
来自专栏Crossin的编程教室

Python老司机给上路新手的3点忠告

在你学习编程的过程中,是否有过以下经历,或正在面临类似的局面: 网上找了很多资料,不知道从哪里看起 买了本书,过了很久也没有看完第一章 开始还能跟着写几行代码,...

456100

扫码关注云+社区

领取腾讯云代金券