Mozilla开源语音识别模型和世界第二大语音数据集

原标题:资源 | Mozilla开源语音识别模型和世界第二大语音数据集

选自Mozilla

机器之心编译

参与:刘晓坤

Mozilla 对语音识别的潜能抱有很大期望,但这一领域目前仍然存在对创新的明显阻碍,这些挑战激发这家公司启动了 DeepSpeech 项目和 Common Voice 项目。近日,他们首次发布了开源语音识别模型,其拥有很高的识别准确率。与此同时,这家公司还发布了世界上第二大的公开语音数据集,该数据集由全球将近 20000 人所贡献。

开源语音识别模型:https://hacks.mozilla.org/2017/11/a-journey-to-10-word-error-rate/

公开语音数据集:https://medium.com/mozilla-open-innovation/sharing-our-common-

DeepSpeech:一个开源的语音到文本的转换引擎,可以达到用户期待的高性能

目前市场上只有少量可用的商业性质的语音识别服务,且被少数几个大公司占据。这限制了初创公司、研究者,甚至那些希望在产品和服务中引入语音功能的大型公司的用户选择和可选特性。

这也是 Mozilla 启动并将 DeepSpeech 作为开源项目的初衷。和一群志同道合的开发者、公司和研究者一起,该公司通过应用复杂的机器学习技术,并开发多项新技术建立了一个语音到文本的转换引擎,它在 LibrSpeech 的 test-clean 数据集上仅有 6.5% 的词错率。

DeepSpeech 项目链接:https://github.com/mozilla/DeepSpeech

Mozilla 首次发布的 DeepSpeech 产品中包括了预构建的 Python 包、NodeJS 包和一个命令行二进制,从而使开发者可以立刻使用并进行语音识别实验。

Common Voice:建立世界上种类最多的公开语音数据集,以及开发最优化的语音训练技术

本文来自企鹅号 - 凤凰网媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏企鹅号快讯

IBM 招聘数据科学家,看重的是哪些技能和特质?

编者按:求职者有时会问 IBM 如何定义“数据科学家”这一职位。这是一个重要的问题,因为市场需要越来越多的数据科学家,IBM 分析师Seth Dobrin 在本...

1880
来自专栏AI科技评论

免费中文版!谷歌机器学习速成课程今日上线!

AI 科技评论按:谷歌的人工智能学习平台横空出世,还有谷歌的免费中文机器学习速成课程! ? 今天,谷歌在以往介绍自己的 AI 产品、开源代码和研究成果的 ai...

3418
来自专栏AI研习社

一篇文章告诉你如何成为数据科学家

通常来说,年轻人都很容易立志成为什么,例如成为一名科学家,然后又很快放弃。这一方面是因为摆在他们面前的诱惑太多,同时也因为成为一名科学家真的很不容易。 这一点放...

3289
来自专栏新智元

投资专家要小心,机器学习正在入侵VC

【新智元导读】机器学习对于投资管理将变得越来越重要,大多数公司将在 5 年内利用机器学习工具或数据,越来越多的战略创新过程将被自动化。本文还提出了解决过拟合问题...

3254
来自专栏AI研习社

「我的第一次数据科学家实习经历」

AI 研习社按:「数据科学家」可谓是近几年的一大热门职位,很多学习了数学、信息、计算机相关专业的同学都对它表示跃跃欲试。Admond Lee 学习了物理专业,...

572
来自专栏新智元

【CCCF动态】计算机网络顶级会议趋势分析

概况 SIGCOMM(ACM Special Interest Group on Data Communications,ACM数据通信专业组)、MobiCom...

3595
来自专栏PPV课数据科学社区

【观点】以“上大学分析”为例体验什么是数据挖掘

某社会机构,收集了大量的学生考大学的数据。该机构希望找出一些规律,以推动更多的学生考大学。该机构委托你来做这个分析工作,给出具体的可以推动更多学生考大学的建议。...

2554
来自专栏镁客网

Facebook推出人工智能引擎DeepText,让机器更好的理解语言和内容

1584
来自专栏WOLFRAM

Stephen Wolfram:如何训练孩子们的计算思维(I)

1496
来自专栏AI科技评论

学界 | 构造一个和人类智能水平相当的人工智能,需要从哪方面努力?

AI科技评论按:本文由图普科技工程师翻译自《Methodology of Human-Level Artificial Intelligence Researc...

27111

扫码关注云+社区