专栏首页机器之心学界 | 无需进行滤波后处理,利用循环推断算法实现歌唱语音分离

学界 | 无需进行滤波后处理,利用循环推断算法实现歌唱语音分离

选自arXiv

机器之心编译

参与:路雪、李泽南

近日,来自 Fraunhofer IDMT、Tampere University of Technology 与蒙特利尔大学的 Yoshua Bengio 等人在 arXiv 上提交了一篇论文,提出跳过使用泛化维纳滤波器进行后处理的步骤,转而使用循环推断算法和稀疏变换步骤进行歌唱语音分离,效果优于之前基于深度学习的方法。这篇论文已经提交至 ICASSP 2018。

论文:Monaural Singing Voice Separation with Skip-Filtering Connections and Recurrent Inference of Time-Frequency Mask

  • 论文链接:https://arxiv.org/abs/1711.01437v1
  • on-line demo 地址:https://js-mim.github.io/mss_pytorch/
  • GitHub 地址:https://github.com/Js-Mim/mss_pytorch

摘要:基于深度学习的歌唱语音分离依赖于时频掩码(time-frequency masking)。在很多情况中,掩码过程(masking process)不是一个可学习的函数,也无法封装进深度学习优化中。这造成的结果就是,大部分现有方法依赖于使用泛化维纳滤波器(generalized Wiener filtering)进行后处理。我们的研究提出一种方法,在训练过程中学习和优化源依赖掩码(source-dependent mask),无需上述后处理步骤。我们引入了一种循环推断算法、一种稀疏变换步骤用于改善掩码生成流程,以及一个学得的去噪滤波器。实验结果证明,与之前单声道歌唱语音分离的顶尖方法相比,该方法使信号失真比(signal to distortion ratio)提高了 0.49 dB,信号干扰比(signal interference ratio)提高了 0.30 dB。

undefined

图 1:方法图示。

表 1:几种方法的中值信号失真比(SDR)和信号干扰比(SIR)(单位为 dB)。下划线为我们提出的方法。值越高效果越好。

结论

本论文中,Bengio 等人展示了一种用于歌唱语音分离的方法,无需使用泛化维纳滤波器进行后处理。研究人员向跳过滤波的连接 [12] 引入了稀疏变换,效果优于使用泛化维纳滤波器的方法。此外,实验证明引入的循环推断算法(recurrent inference algorithm)在单声道语音分离中取得了顶尖的结果。实验结果证明这些扩展优于之前用于歌唱语音分离的深度学习方法。

本文为机器之心编译,转载请联系本公众号获得授权。

本文分享自微信公众号 - 机器之心(almosthuman2014)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 业界 | 快手AI技术副总裁郑文:为什么说AI是短视频平台的核心能力

    郑文是美国斯坦福计算机系博士,研究方向主要集中在计算机图形学和电影特效方面,毕业之后在美国从事机器学习和计算机视觉相关研究,2016 年回国后加盟快手,现任快手...

    机器之心
  • 学界 | 一文概览语音识别中尚未解决的问题

    机器之心
  • 专栏 | 极限元语音算法专家刘斌:基于深度学习的语音生成问题

    机器之心专栏 作者:刘斌 深度学习在 2006 年崭露头角后,近几年取得了快速发展,在学术界和工业界均呈现出指数级增长的趋势;伴随着这项技术的不断成熟,深度...

    机器之心
  • 【OCP最新题库解析(052)--题50】 Which two are true about space

    该系列专题为2018年4月OCP-052考题变革后的最新题库。题库为小麦苗解答,若解答有不对之处,可留言,也可联系小麦苗进行修改。

    小麦苗DBA宝典
  • 重磅!中国量子计算机诞生,创世界纪录

    镁客网
  • 计算机组成基础

    每天工作都在用计算机,玩游戏也在用计算机,移动互联网没有兴起之前撩妹/勾搭小哥哥也是用计算机,到底计算机是由什么组成的?

    小末快跑
  • iOS(CGGeometry)几何类方法总结 原

    CGPoint CGPointMake(CGFloat x, CGFloat y);

    珲少
  • 360安全能否再一次弯道超车?

    摘要:就像08年360去超越别人的节点一样,现在又到了新的时刻:万物互联时代互联网连接一切,安全技术更新换代,360在这个弯道想要守住第一还需要继续努力? 36...

    罗超频道
  • 「镁客·请讲」问之科技翟鲁峰:希望可以用声音传递简易生活方式

    镁客网
  • HTML5设计原理(下)

    平稳退化 下一条原理大家应该都很熟悉了,那就是平稳退化。毕竟,我们已经遵守这条规则好多年了。渐进增强的另一面就是平稳退化。 有关HTML5遵循这条原理的例子,就...

    RP道貌不岸然

扫码关注云+社区

领取腾讯云代金券