Gensim Word2Vec词汇表中的组合向量 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

gensim中的自定义字嵌入

、、

我有一个词嵌入矩阵(例如M)，得到的是V阶，其中V是词汇表的大小，N是每个字向量的大小。我希望gensim的word2vec模型在训练过程中用M初始化它的词嵌入矩阵。我可以使用gensim.models.keyedvectors.Word2VecKeyedVectors.load_word2vec_format(model_file)以word2vec格式加载M，但我不知道如何将M提供给ge

浏览 16提问于2022-05-04得票数 0

1回答

用Gensim* 4.0微调预训练的Word2Vec模型*

、、、

使用Gensim < 4.0，我们可以使用以下代码重新训练word2vec模型：model.train(my_corpus, total_examples=len(my_corpus), epochs=model.epochs) 然而，我理解的是Gensim 4.0不再支持Word2Vec.load_word2vec_fo

浏览 0提问于2021-07-07得票数 2

1回答

如何在显像板投影机中可视化Gensim* Word2vec嵌入*

、、、、

在之后，我训练了一个简单的word2vec模型：from gensim.models import Word2Vecmodel = Word2Vec(sentences=common_texts, size=100, window=5, min_count=1, workers=4) model.save("/contentpython3 -m gensim.sc

浏览 20提问于2021-09-18得票数 5

回答已采纳

6回答

更新gensim* word2vec模型*

、

我有一个用gensim训练过的超过98892个文档的word2vec模型。对于没有出现在句子数组中的任何给定句子(即，我在其上训练模型的集合)，我需要用该句子更新模型，以便下次查询它时会给出一些结果。model.most_similar(positive=['moscow', 'weather', 'cold']) File "/Library/Python/2.7&#

浏览 1提问于2014-03-02得票数 38

1回答

用gensim* 4.0.0与预先训练过的字向量相交的过程*

、

我试着从一个使用一个更老版本的gensim的例子中学习。特别是，我有一段代码，如：word_vectors.build_vocab，当可用时，这会用预先训练过的单词向量来填充单词向量词汇表。当我的词汇表中的单词不在预先训练的

浏览 9提问于2021-10-01得票数 0

回答已采纳

4回答

gensim word2vec访问输入/输出向量

、

在word2vec模型中，有两个线性转换，将词汇空间中的单词转换到隐藏层( " In“向量)，然后返回到词汇空间( "out”向量)。通常，这个输出向量在训练后被丢弃。我想知道在gensim python中是否有一种简单的方法来访问out向量？同样，我如何访问out矩阵？以下是更多细节。从上面的引用中，我们得到了以下<

浏览 107提问于2016-11-07得票数 17

回答已采纳

1回答

用于单个字符而不是单词的Word2Vec返回向量

、、

COMPETITION','prospects','2K15','gather','Mega','SENSOR','NCTT','NETWORKING','orgainsed','acts']from gensim.modelsimport Word2Vec vec_model= Word2Vec(words, min_count=1, si

浏览 2提问于2022-02-12得票数 1

回答已采纳

1回答

在word2vec* gensim模型中添加词嵌入*

、、

我正在寻找一种方法，在word2vec gensim模型中添加预先训练过的单词向量。我在txt中有一个经过预先训练的word2vec模型(单词及其嵌入)，我需要获取特定语料库中的文档和新文档之间的Word Mover的距离(例如通过)。为了避免加载整个词汇表的需要，我只想加载在语料库中找到的预先训练过的模型单词的</em

浏览 3提问于2017-04-24得票数 6

1回答

更新spaCy词汇

、、

我想知道是否有可能更新空间的默认词汇表。我想做的是：但是，由于我的语料库中有很多单词不在空间的默认词汇表中，所以我无法使用导入的向量。是否有一种(容

浏览 2提问于2017-04-20得票数 3

回答已采纳

2回答

从不同的word2vec模型组合/添加向量

、、、、

我正在使用gensim创建大型文本语料库培训的Word2Vec模型。我有一些基于StackExchange数据转储的模型。我也有一个来自英语维基百科语料库的模型。假设两个模型中都有词汇表术语，并且模型的创建具有与Word2Vec相同的参数。有没有办法组合或添加两个独立模型中的向量，以创建一个具有相同单词向量的单一新模型，如果我最

浏览 0提问于2019-01-17得票数 1

回答已采纳

4回答

word2vec -什么是最好的？添加、串联或平均字向量？

、、、、

我正在研究一种反复出现的语言模式。为了学习可以用于初始化我的语言模型的单词嵌入，我使用gensim的word2vec模型。经过训练，word2vec模型对词汇表中的每个单词包含两个向量:单词嵌入(输入/隐藏矩阵行)和上下文嵌入(隐藏/输出矩阵列)。正如中所概述的，至少有三种共同的方法来组合这两个嵌入向量：

浏览 6提问于2017-10-23得票数 20

回答已采纳

1回答

如何在word2vec的训练模型中统计词频？

、、、、

我需要计算word2vec训练模型中每个单词的频率。我如何从word2vec中获取这些数据呢？

浏览 57提问于2019-04-13得票数 0

2回答

如何使用来自另一个模型的词汇表初始化gensim模型？

、、

我从gensim的文档中了解到，它在开始训练之前建立词汇表。在我的例子中，建立词汇表需要很多小时。我想通过重用第一个模型中的词汇表来节省时间。我该怎么做呢？.build_vocab方法不能从另一个模型中获取vocabulary对象。下面是一个虚拟的例子：sentences

浏览 0提问于2019-12-19得票数 0

3回答

从多个词嵌入生成同义词或类似词

、

例如下面的两个例子：-> ->单词嵌入->生成两个单词的同义词->词嵌入词->在该上下文中生成" Word“的同义词我想我会开始和伯特一起..。我该怎么开始？谢谢你的帮助！

浏览 0提问于2020-03-05得票数 5

3回答

加载PreComputed矢量Gensim

、、、

我正在使用Gensim Python包学习一个神经语言模型，我知道您可以提供一个训练语料库来学习该模型。然而，已经存在许多文本格式的预计算词向量(例如)。是否有某种方法可以初始化Gensim Word2Vec模型，该模型只利用一些预先计算的向量，而不必从头开始学习这些向量？谢谢!

浏览 1提问于2014-11-26得票数 25

回答已采纳

3回答

如何从gensim* word2vec中获取词汇量？*

、

我正在使用python中的gensim word2vec包。我知道如何从经过训练的模型中获取词汇表。但是如何获得词汇表中每个单词的词数呢？

浏览 0提问于2016-05-12得票数 12

回答已采纳

2回答

根据您的词汇表调整加载了Gensim的谷歌Word2Vec，然后创建嵌入向量

、、、

我想知道如何才能将谷歌的Word2Vec限制在我的词汇表中。谷歌Word2视频链接：import gensim model = gensim.models.Word2Vec.load_word2vec_formatGoogleNews-vectors-negative300.bin', binary=True) embe

浏览 6提问于2018-04-16得票数 0

3回答

gensim word2vec:查找词汇表中的单词数量

、、、、

使用python 训练word2vec模型后，如何在模型的词汇表中找到单词的数量？

浏览 1提问于2016-02-24得票数 48

回答已采纳

1回答

如何从word2vec模型中计算句子嵌入？

、、、

我是NLP新手，我正在尝试执行集群问题的嵌入。我已经使用Python的word2vec库创建了gensim模型，但我想知道以下几点：foo：

浏览 0提问于2022-02-14得票数 0

2回答

将字符串标记转换为整数

、、、、

我试图把句子的记号转换成整数。但它给我的是浮标。from nltk.tokenize import word_tokenizemodel = Word2Vec([tokens], min_count=1, size=1)print(model

浏览 1提问于2019-06-18得票数 1

回答已采纳

点击加载更多

gensim中的自定义字嵌入

用Gensim* 4.0微调预训练的Word2Vec模型*

如何在显像板投影机中可视化Gensim* Word2vec嵌入*

更新gensim* word2vec模型*

用gensim* 4.0.0与预先训练过的字向量相交的过程*

gensim word2vec访问输入/输出向量

用于单个字符而不是单词的Word2Vec返回向量

在word2vec* gensim模型中添加词嵌入*

更新spaCy词汇

从不同的word2vec模型组合/添加向量

word2vec -什么是最好的？添加、串联或平均字向量？

如何在word2vec的训练模型中统计词频？

如何使用来自另一个模型的词汇表初始化gensim模型？

从多个词嵌入生成同义词或类似词

加载PreComputed矢量Gensim

如何从gensim* word2vec中获取词汇量？*

根据您的词汇表调整加载了Gensim的谷歌Word2Vec，然后创建嵌入向量

gensim word2vec:查找词汇表中的单词数量

如何从word2vec模型中计算句子嵌入？

将字符串标记转换为整数

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐