端到端语音识别
• Espnet: https://github.com/espnet/espnet • 实现了主流的端到端语音识别方法 • Speech-Transformer、LAS、CTC、RNN-T • 一个小缺点:代码量已经越来越多...
• 实践:有GPU机器的话,可以跑一下egs下面的aishell1/2 • Speech Transformer: https://github.com/kaituoxu/Speech-Transformer • Listen, Attend and Spell: https://github.com/kaituoxu/Listen-Attend-Spell