首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何在获得word2vec模型之后将最近/时间用作特性

如何在获得word2vec模型之后将最近/时间用作特性
EN

Data Science用户
提问于 2017-12-24 10:23:40
回答 1查看 206关注 0票数 1

我有一个word 2向量模型,它工作得很好,但假设我输入了Eminem。

它给了我:

说唱,音乐,复兴和复苏。

我如何使另一层显示复苏的第一?

EN

回答 1

Data Science用户

发布于 2017-12-25 09:11:28

Word2vec的目的是它本身将在文本数据中学习一个隐藏的结构。如果“恢复”出现在说唱和音乐之后,是因为Eminem对这些上下文词的使用比恢复更频繁。你不能简单地改变这一点。您应该避免对您的模型进行手动干预。

但是,如果您真的希望“恢复”更接近Eminem这个词,可以尝试以下两种方法:

  • 尝试另一种Word2Vec算法架构。你可以试试CBOW和。在我看来,CBOW可以表现得更好,因为CBOW模型针对它的上下文训练每个单词。它问:“考虑到这组上下文词,什么词可能同时也会出现?”斯基普-格拉姆根据单词对每个上下文进行训练。它问:“考虑到这个单词,还有哪些词可能同时出现在它旁边?”
  • 在数据中添加与恢复相册相关的句子。因为在这些句子中,单词恢复和Eminem应该占主导地位,所以它可以调和这两个词。同样,您也可以复制包含Eminem和recovery单词的句子,并随机更改句子中单词的顺序。
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/25959

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档