我在尝试制造一个轻量级的对讲机语音合成器。一切看起来都很简单,因为我的母语有非常简单的发音和文本处理规则。我遇到的唯一问题就是音高控制。
据我所知,为了控制语音的音高,大多数语音合成器都使用线性预测编码( LPC ),它基本上将音高信息从记录的语音样本中分离出来,然后在合成过程中可以根据需要提供自己的音高。
问题是我不是DSP专家。我使用了一个Ooura库来提取AFR信息,我对使用Hann和Hamming窗口有一点了解(我自己已经实现了C++代码),但大多数情况下我把DSP算法当作黑匣子来处理。
我希望找到一些开源库,它只是简单的LPC代码和用法示例,但我什么也找不到。大多数可用代码(如节日引擎)都紧密集成到synth中,要将其分离并学习如何使用它将是相当困难的任务。
中是否有任何C/C++/C#/Java开源DSP库具有“黑匣子”风格的LPC算法和使用示例,所以我只需向它抛出一个PCM样本数据并得到LPC编码输出,然后抛出编码数据并合成解码的语音数据?。
发布于 2012-08-20 14:47:14
这并不是你想要的,但是也许你从这个非常复杂的工具箱中得到了一些想法:普拉特
https://stackoverflow.com/questions/12019712
复制相似问题