CMU多语种语音数据集:700多种语言的语音/文本对齐语料

【导读】CMU近日发布大规模语音数据集,提供音频、对齐文本和单词发音的700多种不同语言的数据集。平均而言,每种语言提供大约20个小时的句长的转录。

数据爬取自:http://www.bible.is/

List of Languages with relative scores of accuracy of alignment

http://festvox.org/cmu_wilderness/

Map of Languages geopositioned

http://festvox.org/cmu_wilderness/map.html

Github链接地址:

https://github.com/festvox/datasets-CMU_Wilderness

-END-

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-11-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏GopherCoder

『No24: 编写可读代码的艺术(1)』

除了本职工作,还有点幻灯片演示设计的爱好。随着编写代码的增多,制作的的幻灯片越来越多,越来越意识到,很多事物都存在相通性。

10020
来自专栏程序员的知识天地

从C++到Python,一个游戏程序员的进阶之路

我的第一份工作是一加国内知名游戏公司的逻辑程序员,必须技能是C++,但是一开始只是写语法和C++很类似的一种脚本(后来知道是从一个开源脚本引擎AngelScri...

16510
来自专栏ImportSource

程序员求生秘籍

不过即使是假新闻,也着实把人们吓得够呛。为此,我试图理了十个实用动作给大家保平安。

15440
来自专栏数据科学与人工智能

【Python环境】为什么要选择Python语言实现机器学习算法?

基于以下三个原因,我们选择Python作为实现机器学习算法的编程语言:(1) Python的语法清晰;(2) 易于操作纯文本文件;(3) 使用广泛,存在大量的开...

21280
来自专栏Golang语言社区

C++麻将游戏算法深入解析

这两天为了工具箱的完善,整理了这些年引擎开发的一些资料,无意中发现06年写的一个麻将算法,编译运行了一下,还是有点意思的,拿出来整理一下分享给大家。 ...

39340
来自专栏余林丰

桥接模式

桥接模式要把握的很重要的一点就是:类的继承关系和类的组合/聚合关系,何时应该考虑使用何种关系。是不是在编程过程中一味地使用类的继承关系就代表这就是面向对象编程了...

22370
来自专栏程序员维他命

2017年5月iOS招人心得(附面试题)

在2017年5月中旬,技术老大让我招两个1-2年的iOS开发,把简历的筛选和第一轮技术面试的任务交给了我。于是便自己准备了这套面试题。

18240
来自专栏跨界架构师

[译文]Domain Driven Design Reference(四)—— 柔性设计

  要让一个项目加速发展,而不是被其自身的历史包袱所拖累,需要一个能与之良好协作的设计,它会带来改变。一个柔性设计。

14520
来自专栏Java社区

做一个网站真的有那么难吗?

14330
来自专栏企鹅号快讯

对主流编程语言的吐槽

1.C 语言 ? ? 作为拥有「便携式汇编语言」头衔的 C 语言, 绝对充斥着各种问题!相信没有人会喜欢编写,大量独立的头文件,也更没有几个人能在使用预处理器的...

24480

扫码关注云+社区

领取腾讯云代金券