专栏首页小鹏的专栏[语音识别] kaldi -- aidatatang_200zh脚本解析:单音素解码

[语音识别] kaldi -- aidatatang_200zh脚本解析:单音素解码

输入:feats & final.mdl & HCLG.fst

输出:lat.JOB.gz

## 在dev数据集上执行
steps/decode.sh --cmd "$decode_cmd" --config conf/decode.config --nj 10 \
  exp/mono/graph data/dev exp/mono/decode_dev
## 在test数据集上执行
steps/decode.sh --cmd "$decode_cmd" --config conf/decode.config --nj 10 \
  exp/mono/graph data/test exp/mono/decode_test

流程:

1. gmm-latgen-faster # 生成基于GMM模型的lattice词格
2. steps/diagnostic/analyze_lats.sh
3. local/score.sh
    3.1 steps/score_kaldi.sh
    3.2 steps/scoring/score_kaldi_cer.sh --stage 2

备注:

  1. 解码器
  • 目录:src/gmmbin/gmm-latgen-faster.cc
  • 输入:final.mdl & feats & HCLG.fst
  • 输出:lat.JOB.gz
$beam = 13 # beam对象,越大越慢也越准确,默认16,这里13
$max_active = 7000 # 解码器最大活跃的状态,越大越准确但是也越慢,默认2147483647(最大的32为有符号整数),这里是7000
$lattice_beam =

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • [语音识别] kaldi -- aidatatang_200zh脚本解析:音素训练

    MachineLP
  • [语音识别] kaldi -- aidatatang_200zh脚本解析:三音速详解

    mkgraph.sh主要生成了HCLG.fst和words.txt这两个重要的文件,后续识别主要利用了三个文件,分别是final.mdl、HCLG.fst、wo...

    MachineLP
  • [语音识别] 01 语音识别概述

    英文数据 • TIMIT:音素识别,LDC版权 • WSJ:新闻播报,LDC版权 • Switchboard:电话对话,LDC版权 • Aurora4,...

    MachineLP
  • 语音识别开源工具PyTorch-Kaldi:兼顾Kaldi效率与PyTorch灵活性

    杰出的科学家和工程师们一直在努力地给机器赋予自然交流的能力,语音识别就是其中的一个重要环节。人类对语音识别技术的研究从上世纪 50 年代开始就未曾停止。在长期的...

    机器之心
  • PyTorch+Kaldi、专注E2E语音识别,腾讯AI Lab开源轻量级语音处理工具包PIKA

    Kaldi 是一个开源的语音识别系统,由 Daniel Povey 主导开发,在很多语音识别测试和应用中广泛使用。但它依赖大量脚本语言,且核心算法是用 C++ ...

    磐创AI
  • 横评:五款免费开源的语音识别工具

    编者按:本文原作者 Cindi Thompson,美国德克萨斯大学奥斯汀分校(University of Texas at Austin)计算机科学博士,数据科...

    AI研习社
  • 独家 | 一文读懂语音识别(附学习资源)

    一、前言 6月27日,美国权威科技杂志《MIT科技评论》公布2017全球最聪明50家公司榜单。科大讯飞名列中国第一、全球第六。全世界排在科大讯飞前面企业分别是:...

    数据派THU
  • 开发 | Kaldi集成TensorFlow,两个开源社区终于要一起玩耍了

    AI科技评论按:自动语音识别(Automatic speech recognition,ASR)领域被广泛使用的开源语音识别工具包 Kaldi 现在也集成了Te...

    AI科技评论
  • [语音识别] 05 基于GMM-HMM的语音识别系统(单音素、三音素)

    MachineLP
  • 资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南、Smith 目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了...

    机器之心
  • 纯PyTorch语音工具包SpeechBrain开源,Kaldi:我压力有点大

    语音处理技术的进步,是人工智能改变大众的生活的重要一环。深度学习技术的兴起,也让这一领域近年来得到了长足的发展。在过往,该领域的主要方法是为不同的任务开发不同的...

    机器之心
  • 最关键、最难啃的技术,被这群小米工程师搞定了

    「人才是我们的创新之源。小米今年新招聘入职的数量已超过 2250 人,研发团队规模达到了一万人。2021 年我们还将扩招 5000 名工程师,进一步扩充研发团队...

    机器之心
  • 业界 | DuerOS普罗米修斯计划:30页国际专家PPT全面剖析对话式AI数据集

    机器之心发布 百度 DuerOS 美国西部时间 11 月 9 日,百度 DuerOS 普罗米修斯计划在美国硅谷召开启动发布会。一周后,2017 百度世界大会上,...

    机器之心
  • 学界 | 新研究将GRU简化成单门架构,或更适用于语音识别

    选自arXiv 机器之心编译 参与:Panda Yoshua Bengio 领导的一个团队近日在 arXiv 上发布了一篇论文,介绍了他们通过修改门控循环单元(...

    机器之心
  • Kaldi拜拜!PyTorch语音工具包SpeechBrain要来了,支持多种语音任务,实现最强水准

    现在,图灵奖得主、AI三巨头之一Yoshua Bengio领衔的研究机构Mila宣布,要联合英伟达、杜比、三星、PyTorch官方、IBM AI研究院等公司和机...

    量子位
  • Kaldi拜拜!PyTorch语音工具包SpeechBrain要来了,支持多种语音任务,实现最强水准

    现在,图灵奖得主、AI三巨头之一Yoshua Bengio领衔的研究机构Mila宣布,要联合英伟达、杜比、三星、PyTorch官方、IBM AI研究院等公司和机...

    代码医生工作室
  • 语音界传奇Dan Povey突遭美霍普金斯大学解雇,计划转投中国

    语音界大佬、开源语音识别系统 kaldi 的开发者 Dan Povey 被约翰・霍普金斯大学 (JHU) 解雇了。

    新智元
  • 语音识别大牛莫名被JHU开除后,怒拒Facebook,转向中国公司与高校

    作为语音识别领域的大牛,Daniel Povey 教授此前一直在负责霍普金斯语言语音处理中心的工作。他曾主导开发了语音识别工具库 Kaldi,该工具库支持多种语...

    机器之心
  • 语音识别技术发展迅速,这本书是你需要的全方位解读语音识别的最新著作!

    随着物联网技术和智能设备技术的快速发展,人与机器的交互,不再仅依赖于鼠标和键盘,更有可能的是直接采用语音。

    博文视点Broadview

扫码关注云+社区

领取腾讯云代金券