王珺 | 智能音箱语音识别技术分享

讲师

王珺

腾讯专家研究员

腾讯AI Lab专家研究员,在北大、中科院声学所、杜比实验室等科研机构有十多年研究经历,专注于语音和声音的信号前处理、增强、抑制、分离等后处理及语音识别的研究。目前的研究兴趣包括音频信号处理、关键词唤醒和多说话人分离以及端到端的语音识别中的关键技术。

议题介绍

腾讯云在智能音箱交互场景,远场语音识别方面的真实数据评测字准确率和句准确率实现了大幅提升。本议题介绍腾讯AI Lab的音箱语音交互技术链条以及其中若干关键技术模块。本议题将进一步分享针对智能音箱场景的前沿研究和新的技术方案,包括基于唤醒词信息的目标说话人语音提取,以及性能处于国际领先的Attention系统:识别端到端的Attention建模方法改进,若干改进Attention的关键技术点,用于深度融合Attention和CTC的多任务训练方法的研究。

扫码关注云+社区