专栏首页小鹏的专栏[语音识别] 10 端到端语音识别

[语音识别] 10 端到端语音识别

端到端语音识别

• Espnet: https://github.com/espnet/espnet • 实现了主流的端到端语音识别方法 • Speech-Transformer、LAS、CTC、RNN-T • 一个小缺点:代码量已经越来越多...

• 实践:有GPU机器的话,可以跑一下egs下面的aishell1/2 • Speech Transformer: https://github.com/kaituoxu/Speech-Transformer • Listen, Attend and Spell: https://github.com/kaituoxu/Listen-Attend-Spell

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Attention 待更新

    注意力机制可以描述为一个函数,这个函数将query和一组key-value对映射成一个输出。

    MachineLP
  • ELMO/BERT/Transformer笔记 (备用)

    (1)词向量与ELMO模型:https://www.bilibili.com/video/av89296151?p=1

    MachineLP
  • data_structure_and_algorithm -- 哈希算法(上):如何防止数据库中的用户被脱库?

    还记得 2011 年 CSDN 的“脱库”事件吗?当时,CSDN 网站被黑客攻击,超过 600 万用户的注册邮箱和密码明文被泄露,很多网友对 CSDN 明文保存...

    MachineLP
  • 史上最强内网渗透知识点总结

    文章内容没谈 snmp 利用,可以去乌云等社区获取,没有后续内网持久化,日志处理等内容。

    信安之路
  • 深度学习图像标注工具汇总

    版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/...

    chaibubble
  • 资源 | 深度学习图像标注工具汇总

    用户1737318
  • 资源 | 深度学习图像标注工具汇总

    对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限。世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务。但是数据标注是个耗时耗力的...

    AI科技大本营
  • 资源 | 深度学习图像标注工具汇总

    对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限。世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务。但是数据标注是个耗时耗力的...

    IT派
  • 深度学习图像标注工具

    对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限。世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务。但是数据标注是个耗时耗力的...

    朱晓霞
  • 一个支付宝竟使用了30多个开源软件

    大家都会使用支付宝,在支付宝中的“设置”选项中,有一项为“关于”,在版权信息中显示了所有使用的开源软件信息。不看不知道,一看吓一跳,原来支付宝居然使用了30多个...

    养码场

扫码关注云+社区

领取腾讯云代金券