当我有一个新字符串,并试图在原始训练语料库中找到与字符串的余弦相似性时,我注意到,即使字符串是一个完全匹配的字符串,再加上新字符串中的附加新标记,也会发现余弦相似度为1.0,无论有多少这样的额外标记。例如,如果x、y和z不在原始语料库中,形式“at”的新字符串将与原始字符串"a b“具有余弦相似性1.0。我理解这种情况是如何发生的,因为在根据训练语料库建立的特性向量化新字符串时,忽略了新的标记,但我希望能够检测到"a b x y z“实际上并不是"a b”的“完美”匹配。对于
当将周期二维信号从图像空间转换到傅里叶空间并返回时,重构信号的为原始信号频率的两倍(见下图)。我尝试使用来自NumPy和OpenCV的离散傅里叶变换,两者的结果是相同的。当使用一维DFT和IDFT时,不会出现这个问题。
下面是Python中的示例代码,演示了这个问题:import numpy as np
w = 320
# frequency of cosine wave w.r.t. the imag