首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

语音识别系列︱paddlehub的开源语音识别模型测试(二)

---- 文章目录 1 paddlehub的安装 2 几款模型 3 三款语音识别模型实验 3.1 deepspeech2_aishell - 0.065 3.2 u2_conformer_wenetspeech...- 0.087 3.3 u2_conformer_aishell - 0.055 4 文本-标点恢复 5 语音识别 + 标点恢复 案例 ---- 1 paddlehub的安装 先把paddlepaddle...hub install u2_conformer_wenetspeech hub install u2_conformer_aishell 模型三个链接: u2_conformer_aishell deepspeech2...deepspeech2_aishell使用了DeepSpeech2离线模型的结构,模型主要由2层卷积网络和3层GRU组成,并在中文普通话开源语音数据集AISHELL-1进行了预训练,该模型在其测试集上的...u2_conformer_aishell在中文普通话开源语音数据集AISHELL-1进行了预训练,该模型在其测试集上的CER指标是0.055257。

6.6K20
您找到你想要的搜索结果了吗?
是的
没有找到

依图要修AI语音双学位,左手摸底考第一名成绩单,右手开放平台方案

No.1成绩单 依图这次秀出的入局成绩单,源自全球最大的中文开源数据库AISHELL-2。 该数据库表现中,依图短语音听写的字错率(CER)为3.71%,比之原最好成绩还好20%,大幅刷新纪录。...语音领域玩家想必对AISHELL-2并不陌生。 ? 这是AISHELL Foundation和希尔贝壳宣布的开源数据库,数据规模达1000小时,是目前全球最大的中文开源数据库。...AISHELL-2由1991名来自中国不同口音区域的发言人参与录制,经过专业语音校对人员转写标注,通过了严格质量检验,数据库文本正确率在96%以上,录音文本涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等...其中,在AISHELL2-2018A-EVAL数据集中,依图的识别准确率达96.29%,字错率3.71%,比原最好成绩高出20%。 但成绩单之余,或许你也好奇:依图为啥要进语音领域?

59220

飞桨开发者又出新工具!让AI也能听懂你的话

Windows 10 or Ubuntu 18.04 源码地址:https://github.com/yeyupiaoling/PPASR 模型下载 本项目在各个公开数据集上的字错率见下表: 说明:aishell...dataset/test.wav 消耗时间:132, 识别结果: 近几年不但我用书给女儿儿压岁也劝说亲朋不要给女儿压岁钱而改送压岁书, 得分: 94 数据准备 本项目使用了公开的中文普通话语音数据集,分别是Aishell...cd download_data/ python aishell.py python free_st_chinese_mandarin_corpus.py python thchs_30.py python...我把aishell.py的文件单独下载,然后替换download()函数,再执行该程序,就会自动解压文件文本生成数据列表。...# 把这行代码 filepath = download(url, md5sum, target_dir) # 修改为 filepath = "D:\\Download\\data_aishell.tgz

67720

依图做语音了!识别精度创中文语音识别新高点

依图语音识别算法在全球最大开源中文数据库AISHELL-2上词错率仅3.71%,比原业内领先者提升约20%,大幅刷新现有纪录。比对各家语音识别算法,当今智能语音战场,英雄唯讯飞与依图尔?...技术上,在全球最大的中文开源数据库AISHELL-2中,依图短语音听写的字错率(CER)达到3.71%[1],相比原业内领先者提升约20%,大幅刷新现有纪录。...在全球最大中文开源数据库AISHELL-2[2] 的三个测试子集,以及来自第三方的近场口音测试集(Accent)、近场安静聊天测试集(Chat)、语音节目测试集、电话测试集、远场测试集等测试场景中,依图均处于业界领先水平...其中,在AISHELL2的-2018A-EVAL数据集中,依图的识别准确率高达96.29%,字错率仅为3.71%,领先第二名约20%。...注释 [1] 一般在英文语音识别中用“词错率”(WER),因为最小单元是词;中文语音识别一般使用“字错率”(CER),因为最小单元是字. [2] AISHELL-2是AISHELL Foundation

1.7K30

基于PaddlePaddle实现的DeepSpeech2端到端中文语音识模型

https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech 模型下载 数据集 卷积层数量 循环神经网络的数量 循环神经网络的大小 测试集字错率 下载地址 aishell...mirrors.aliyun.com/pypi/simple/ 数据准备 在download_data目录下是公开数据集的下载和制作训练数据列表和词汇表的,本项目提供了下载公开的中文普通话语音数据集,分别是Aishell...cd download_data/ python aishell.py python free_st_chinese_mandarin_corpus.py python thchs_30.py python...然后把download()函数改为文件的绝对路径,如下,我把aishell.py的文件单独下载,然后替换download()函数,再执行该程序,就会自动解压文件文本生成数据列表。...# 把这行代码 filepath = download(url, md5sum, target_dir) # 修改为 filepath = "D:\\Download\\data_aishell.tgz

2.3K10

PPASR流式与非流式语音识别

本项目使用的环境: Anaconda 3 Python 3.7 PaddlePaddle 2.2.0 Windows 10 or Ubuntu 18.04 模型下载 数据集 使用模型 测试集字错率 下载地址 aishell...除了aishell数据集按照数据集本身划分的训练数据和测试数据,其他的都是按照项目设置的固定比例划分训练数据和测试数据。...cd download_data/ python aishell.py python free_st_chinese_mandarin_corpus.py python thchs_30.py python...然后把download()函数改为文件的绝对路径,如下,我把aishell.py的文件单独下载,然后替换download()函数,再执行该程序,就会自动解压文件文本生成数据列表。...# 把这行代码 filepath = download(url, md5sum, target_dir) # 修改为 filepath = "D:\\Download\\data_aishell.tgz

1.2K10
领券