我有一些旋转机器的录音,一个是机器正常工作的时候,另一个是有问题的时候。通过ear,我们可以听到不同之处,但当我计算两个录音的FFT频谱时,频谱看起来几乎相同(即使是最小的盒子)。所以我想知道是否有FFT的替代品,或者我做得不对。我的目标是自动找出我们听到的不同之处,以便每次机器不能正常工作时都能通知我。
谢谢
发布于 2020-05-16 18:00:22
如果在时间-频率域中查看这些数据,则可以清楚地看到它们之间的差异。在此图像中,我在Audacity中打开了音频剪辑,并切换到了频谱图视图(使用曲目上名称的下拉菜单)。

在正常操作中(顶行),在<400 Hz处可以看到非常清晰的音调内容,并且在2000 top附近有一个非常清晰的分量。在异常情况下(底部一行),可以看到覆盖整个频率范围的周期性能量爆发。
使用机器学习模型(给定足够的数据),这两种模式应该很容易区分。例如,频谱图上的小卷积神经网络或递归神经网络。这种用例通常是通过异常检测设置来处理的,其中一个人只在正常数据上训练模型。然而,标记的异常数据对于验证非常有用。
作为参考,我在Audacity中使用的设置如下:

尊敬的Jon Nordby,CTO @ Soundsensing AS,机器听力方面的专家
发布于 2020-05-15 02:40:32
我建议检查信号在时间上的差异,而不是频率上的差异。将两个信号的能量归一化,找到使它们之间的相关性最大化的最佳移位,然后查看信号之间的算术差异,看看这是否能解释您的耳朵所听到的内容。
希望这能对你有所帮助。
https://stackoverflow.com/questions/61796150
复制相似问题