我正在学习Doc2Vec的Gensim教程:https://medium.com/@mishra.thedeepak/doc2vec-simple-implementation-example-df2afbbfbad5
现在,在结束之后,我想计算训练数据中文档的相似度分数。这些文档向量由model.docvecs[0]
、model.docvecs[1]
等提供
但是当我试着跑的时候
cossim(model.docvecs[0], model.docvecs[1])
我得到了TypeError cannot convert dictionary update sequence element #0 to a sequence
。如何计算训练数据中文档之间的余弦相似度?
发布于 2020-08-10 08:15:39
Here很好地解释了这个错误的含义。
Here很好地解释了在您的案例中到底发生了什么。
因此,正如keyed vectors文档中提到的,您应该使用model.docvecs.distance(0, 1)
来计算两个文档之间的余弦距离。
https://stackoverflow.com/questions/63332404
复制相似问题