如何利用D1和D2两种文档之间的欧氏距离(相似性)计算相对频率?
下面是两个文档之间使用绝对频率的余弦和欧氏距离的例子。
D1 (frequencies) = 4,9,7,0,0,3. = {16+81+49+9} = sqrt (155) = 12.45
D2 (frequencies) = 4,5,0,7,5,0. = {16+25+49+25} = sqrt (115) = 10.72
余弦绝对频率的余弦D1,D2 = (4x4+9x5) / 12.45x10.72 = 0.4569 (绝对频率和相对频率)与相对频率相同
也是
D1,D2 =sqrt( sqr(4-4) + sqr(9-5) + sqr(7) + sqr(7) + sqr(5) + sqr(3) )= sqrt( 0+16+49+49+25+9) = sqrt( 148 )=12.17(绝对频率)。
相对频率为0.2532。
我试图得到这个问题的相对频率(欧几里得),我还没有找到任何帮助的教程。我所能找到的只有0.2532的答案,没有公式或解释。
发布于 2017-11-11 10:36:42
阅读欧几里德距离这里以更好地理解
https://stackoverflow.com/questions/25284120
复制相似问题