我正在训练一个关于刺激的神经网络,这个神经网络是用来模拟一项感觉神经科学任务的,用来比较性能和人类的结果。
该任务基于音频的空间定位。我需要在python中生成白噪声音频,以呈现给神经网络,但也需要改变音频,就好像它是在不同的位置呈现的。我理解如何产生音频,但我不确定如何从不同的理论位置产生白噪声。
发布于 2021-12-31 02:48:12
您可以添加一个延迟的右或左轨道,以说明到达的时间在两个耳朵。如果我没记错的话,它相当于大约25或30毫秒,取决于角度。用基本三角法计算源到两耳的行程距离差,然后乘以空气中的声速,得到延迟长度。(IDK python用于控制延迟或者可以指定什么粒度的延迟长度。)
我们对于空间位置的其他大部分线索都很难量化。当然,我们最常使用的是音量。特别是对于高音调的内容(波长小于头的宽度),头部本身可能会阻塞,并造成一些体积差异,根据角度。
但很大程度上来自于环境信号的混响,来自音高对距离的影响(一种安静的声音,混合中有很多高的声音听起来就像它们就在你的耳朵旁边),从移动头部从不同的角度捕捉声音,以及从耳廓的过滤效果。因为每个人的耳朵形状是不同的,我不知道有一个通用的缩略图算法,是什么导致一个声音被感知为起源于一个特定的高度,一个给定的角度。我认为,在某种程度上,我们只是通过用自己的耳朵来体验声音,同时用视觉观察声源来学习的。
https://stackoverflow.com/questions/70532557
复制相似问题