首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何使用doc2vec查找两个字符串列表之间的相似度?

如何使用doc2vec查找两个字符串列表之间的相似度?
EN

Stack Overflow用户
提问于 2019-05-27 21:04:42
回答 1查看 265关注 0票数 -3

我有一个字符串列表,如下所示。我希望看到使用Doc2Vec的list1和list2之间的相似性。

代码语言:javascript
复制
list1 = [['i','love','machine','learning','its','awesome'],['i', 'love', 'coding', 'in', 'python'],['i', 'love', 'building', 'chatbots']]
list2 = ['i', 'love', 'chatbots']
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-28 02:28:36

如果您正在使用gensim库中的Doc2Vec实现,有介绍此内容的介绍笔记本。例如,请参阅文件doc2vec-lee.ipynb,该文件位于gensim docs/notebooks目录中(您可以并且应该在本地运行该文件),或者可以在以下位置在线查看:

https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-lee.ipynb

请注意:

  • 您将需要一个在更多数据上进行训练的模型-理想情况下,每个文本至少是一个句子
  • 如果要比较的两个文本是训练集的一部分,您可以从模型
  • 中检索学习到的文档向量如果要比较的两个文本不是训练集的一部分,则可以使用该模型为它们推断文档向量,如该笔记本

中所示

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56326698

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档