科研人员提出一种基于卷积循环神经网络的单通道渐进语音增强方法

文章来源：企鹅号 - 王小麦育儿

在复杂的声学应用场景中，语音信号易受到环境噪声与房间混响的影响，给自动语音识别和语音通信带来较大的干扰。尽管目前基于深度学习的单通道语音增强方法可有效抑制干扰成分，但这些方法的网络参数量较大且运算复杂度较高，难以应用于低功耗设备。

对此，中国科学院声学研究所噪声与振动重点实验室研究生李安冬、研究员郑成诗等，提出一种基于卷积循环的单通道渐进语音增强方法，在保持增强性能不变的前提下，减小了参数量并降低了运算复杂度。相关研究成果线发表在 Applied Acoustics 上。

研究人员在卷积循环神经网络基础上将增强过程分解为多个子阶段，在每个子阶段中进行轻量级模块建模并提升一部分语音的信噪比，从而在后续阶段中能够把之前阶段的输出作为先验信息，逐步提升后续处理结果。同时通过在不同阶段复用LSTM（Long and Short-Term Memory）模块的方式减小参数量。

科技动态

1、中科院16项专利获得第二十一届中国专利奖

2、合肥综合性国家科学中心启动建设地球和空间前沿研究基地

3、中科院与湖北省政府签署科技合作协议共建东湖科学中心等一批重大园区和平台

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货