我想使用python来处理一个只能识别我的声音的音频文件。例如,我对一辆覆盆子圆周率汽车说“前进”。它会一直往前走,但其他说“前进”的人不能控制我的车。
或者我想把另一个人的声音当作噪音并消除它。我该怎么做呢?有人告诉我可以使用pca或ica来减少这些噪声。
发布于 2019-05-17 20:49:08
您首先识别该命令,然后使用i向量或d向量提取说话者来识别您。
例如,你可以找到算法in Apple's blog的描述。你可以在Kaldi中找到上述算法的实现,但它们并不是很容易集成。
https://stackoverflow.com/questions/56183197
复制相似问题