学习
实践
活动
工具
TVP
写文章

Music alignment和transcription文献整理小结

我们用3个星期的时间整理了Music alignment和transcription的15篇文献。相关的方法是probablistic model和deep learning。今天把这些链接汇总一下:

Music alignment probabilistic model:

Music transcription probabilistic model:

Music transcription deep learning:

关于deep learning的我觉得比较重要的文献都在这里了。其他方法比如NMF, PLCA请看这个tutorial:

关于alignment和transcription的还有其他的一些新研究,

Alignment比如

Computational Methods for the Alignment and Score-Informed Transcription of Piano Music

比如用专门做post-processing, language model的:

(1) A study on LSTM networks for polyphonic music sequence modelling

(2) Polyphonic Music Sequence Transduction with Meter-Constrained LSTM Networks

再比如用多个网络模型层层叠加的:

Polyphonic Pitch Tracking with Deep Layered Learning

由于一些不可知的原因,就不review了。

看了这些文献后,给我的感觉是大部分的新研究(deep learning)集中于钢琴,可能是因为又MAPS这个数据库。钢琴好弄的地方可能在于每个音符没有什么装饰音,难做的地方在于它是polyphonic。如果换成人声或是不同乐器合奏的polyphonic可能就没有这么好弄了,看到这两篇:

(1)R. Schramm, A. McLeod, M. Steedman, and E. Benetos, "Multi-pitch detection and voice assignment for a capella recording of multiple singers", 18th International Society for Music Information Retrieval Conference, pp. 552-559, Oct. 2017.

(2)E. Benetos, "Polyphonic note and instrument tracking using linear dynamical systems", in Proc. 2017 AES International Conference on Semantic Audio, June 2017.

但是用的不是deep learning的方法。可能大家还不清楚怎么用deep learning在学习音符的同时也能把不同的乐器分开。有想做的朋友可以试试这个思路,用多个objectives同时学,一个学onset, 一个学pitch,一个学乐器分离。要是真做出来了,请我吃饭。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180502G05THK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券