首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有预先训练好的doc2vec模型?

是否有预先训练好的doc2vec模型?
EN

Stack Overflow用户
提问于 2018-07-02 17:25:08
回答 2查看 14.1K关注 0票数 12

有没有像维基百科或类似的具有大型数据集的预先训练好的doc2vec模型?

EN

回答 2

Stack Overflow用户

发布于 2018-07-10 11:48:07

我不知道有什么好的。有一个链接来自this project,但是:

  • 它基于一个旧版本的自定义分支,所以不会加载最近的代码
  • 它不清楚什么参数或数据是用来训练它的,而且相关的论文可能对参数的影响做了不知情的选择
  • 它似乎没有合适的大小来包括维基百科文章(400万以上)或文章段落(数千万)的实际文档向量,或者大量的单词向量,所以不清楚什么被丢弃了

虽然它需要很长的时间和大量的工作内存,但有一个Jupyter笔记本演示了如何从包含在gensim中的维基百科创建Doc2Vec模型:

https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-wikipedia.ipynb

所以,我建议你改正你尝试中的错误。(如果您成功创建了模型,并希望为其他人记录该模型,则可以将其上载到某个位置以供其他人重用。)

票数 6
EN

Stack Overflow用户

发布于 2018-11-16 03:14:32

是!我可以在这个link上找到两个预先训练好的doc2vec模型

但仍然找不到任何针对推文进行训练的预训练doc2vec模型

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51132848

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档