我们有超过100000个不同语言的语音样本。我们想做一些辩证的研究。对于这个目标,我们需要将语音分割为单独的音素,以便稍后进行比较。
我们如何做到这一点?
我们需要库(更适合于.net)或服务,或者alghoritm或开源软件来在我们的软件中实现这一点。
谢谢!
发布于 2017-03-14 17:27:34
您可以尝试aubio:http://aubio.org/“瞬态/稳态分离”功能可用于分割,而MFCC可用于分类/识别。
https://stackoverflow.com/questions/42771471
复制相似问题