在此实现https://github.com/stanfordnlp/GloVe/tree/master/src之后,我在我的文本语料库上使用c++应用程序构建了手套模型。我想找到嵌入这个词的方式
如果A与B相关,C与D相关,则and +B应等于D。例如,“澳大利亚”-“堪培拉”+“印度”的嵌入向量算法应等于嵌入“新德里”。
我想在python中评估这些嵌入。
发布于 2017-08-16 10:23:26
任何A B C D
的评估步骤
D'
计算D' = A-C+B
的矢量表示。v
中的所有单词向量GloV,计算v
和D'
的余弦相似度。D'
最相似的向量是否实际上是预期的单词D
。这样的结果可以被看作是信息检索的@top1类评估。您可以更改第三步以获得@top k
。
https://stackoverflow.com/questions/45698204
复制相似问题