首页
学习
活动
专区
工具
TVP
发布

AISHELL-2:全球最大中文开源数据库

2017年7月

北京希尔贝壳科技有限公司(AISHELL)在Kaldi平台上开源178小时中文普通话数据库(AISHELL-1),同时以aishell命名的recipe项目merge到kaldi里。

数据下载地址:

http://www.openslr.org/33/

recipe地址:

https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell/s5

详情:

http://www.aishelltech.com/kysjcp

2017年12月

aishell的recipe更新添加了说话人识别到kaldi。

recipe地址:

https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell/v1

AISHELL-2

一年过去了AISHELL和AISHELL Foundation的伙伴们再次刷新历史,大家期盼已久的AISHELL-2来了,数据规模达到1000小时和更优秀的系统级recipe,同时,也成为目前全球最大中文开源数据库。

数据以硬盘和网盘形式免费开放给高校科研教育机构。

AISHELL-2还配备了一套evaluation数据集,TEST&DEV数据包含了iOS、Android、高保真Mic三种设备,使实验测试更科学和多样性。

1000小时的数据详情:

recipe地址:

https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell2

AISHELL-2实验的训练集,开发集,测试集构成。具体分配如下:

AISHELL-2 data:

- Sampling Rate : 16kHz

- Sample Format : 16bit

- Environment : Indoor

- Speech Data Type : PCM

- Channel Number : 1

- Recording Equipment : iOS

- Time : 1000 hours of speech data (around 1 million utterances)

- Speaker : 1991 speakers (845 male and 1146 female)

语音识别系统完全使用kaldi来训练和识别,测试结果如下:

数据获取方式:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180620B1SX0700?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券