首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于预训练word2vec向量的上下文词嵌入

基于预训练word2vec向量的上下文词嵌入
EN

Stack Overflow用户
提问于 2022-05-17 15:33:03
回答 1查看 147关注 0票数 0

我想要创建考虑到上下文的单词嵌入,所以Jaguar动物这个词的向量将不同于Jaguar汽车品牌。

正如您所知道的,word2vec只给出了一个给定单词的表示,我希望使用已经经过预先训练的嵌入,并通过上下文丰富它们。到目前为止,我已经尝试了一种简单的方法,获取单词和类别词的平均向量,例如像这样

现在我想尝试创建和训练一个需要整个句子的神经网络。

  1. 捷豹F-佩斯是一个伟大的SUV跑车。
  2. 在猫中,只有老虎和狮子比美洲虎大。

然后它将承担文本分类的任务(我有一个包含几个类别的数据集,如动物、汽车等),但是结果将是jaguar这个词的新表示,但是在不同的上下文中,因此两种不同的嵌入。

有人知道我怎么能建立这样一个网络吗?我并不掩饰自己是个初学者,也不知道该怎么做。

EN

回答 1

Stack Overflow用户

发布于 2022-05-18 18:31:30

如果您已经能够在word2vec之外执行语义消歧,那么您可以更改单词-记号以反映您的外部判断。例如,将令牌'jaguar'的某些外观更改为'jaguar*car',将其他外观更改为'jaguar*animal'。继续进行正常的word2vec训练,然后将得到两个不同的标记,两个不同的字向量。

如果你希望培训能发现这些问题,就像~Erwan在一篇评论中提到的那样,这似乎是一个开放式的研究问题,没有一个标准的或现成的解决方案,初学者可以顺便加入。

我曾经看过一篇论文(大约在原始word2vec论文的时候,但现在找不到链接),它试图通过传统的多义-遗忘式的训练,以一种与Word2vec兼容的方式来做到这一点。然后,对于一个单词X的每一个外观,通过一定数量的位置内的邻居的单词向量的组合来建模它周围的上下文。(这本身非常类似于在word2vec的CBOW模式下编写上下文向量。)在所有的上下文集合上进行一些聚类,想出一些其他感官的概念--每个感官都与一个集群相关联。然后,在原始语料库的后续传递中,将word-记号替换为那些也反映其附近上下文集群的标记。(例如:'jaguar'可以替换为'jaguar*1''jaguar*2'等,在此基础上,它的上下文建议使用离散的集群。)然后,重复(或继续) word2vec训练,以获得特定意义的单词向量.当然,问题就在于上下文是如何定义的,聚类是如何推导的,以及棘手的边缘案例(文本的作者本身也在运用多重意义)。

为了在word2vec模型中建模或推导多义词,还有一些有趣的工作:

但在上面,我还没有看到这些技术以一种很容易进入另一个项目的形式被广泛实现/采用。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72276868

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档