如何在gensim word2vec模型中寻找二元语法相似度 - 腾讯云开发者社区

python、nlp、gensim

为了使用gensim.similarities.docsim.Similarity类计算单词之间的相似度，需要提供语料库和字典的大小。在我的例子中，语料库是使用word2vec模型计算的词向量。我想知道为什么gensim需要这么大的字典？另外，如果这里需要用于创建word2vec模型的字典的大小，或者语料库的字典的大小，我想要计算其相似度。

浏览 0提问于2020-06-23得票数 0

14回答

如何用python的gensim word2vec模型计算句子相似度

python、gensim、word2vec

根据，我可以使用gensim软件包中的word2vec模型来计算两个词之间的相似度。例如：0.73723527 然而，word2vec模型无法预测句子的相似性。在gensim中，我发现了具有句子相似性的LSI模型，但这似乎不能与wo

浏览 13提问于2014-03-02得票数 144

回答已采纳

1回答

如何在gensim* word2vec模型中寻找二元语法相似度*

machine-learning、nlp、gensim、word2vec

这里我有一个新闻模型，假设我使用google- word2vec -300模型 import gensim.downloader as api word2vec_model300 = api.load('word2vec-google-news-300') 我想为"AI“或"artifical intelligence”找到相似的单词，所以我想写 word2vec_model300.most_similar("artifical intelligence&

浏览 47提问于2021-11-10得票数 2

回答已采纳

5回答

如何用word2vec计算出两个词的相似距离？

word2vec

Word2vec是一个开源工具，用于计算谷歌提供的单词距离。它可以通过输入一个单词并根据相似度输出排序的单词列表来使用。例如。germany 0.563291然而，我需要做的是通过给出两个单词来计算相似距离

浏览 2提问于2014-02-24得票数 46

回答已采纳

2回答

如何使用Word2Vec计算句子相似度得分

nlp、gensim、word2vec

我是NLP的新手，如何找到两个句子之间的相似度，以及如何打印每个单词的分数。以及如何实现gensim word2Vec模型。试试这个代码:下面是我的两句话：sentence2=" I am going to Bharat"import numpy as np words1 = sentence

浏览 0提问于2019-06-29得票数 0

1回答

使用预训练的Bert，Elmo获得两个单词之间的相似度分数

nlp、gensim、word2vec、word-embedding、elmo

我正在尝试使用预训练的维基模型来比较Glove，Fasttext，Bert，Elmo在两个单词之间的相似度。Glove和Fasttext有预训练的模型，可以很容易地与python中的gensim word2vec一起使用。Elmo和Bert有这样的模型吗？

浏览 74提问于2019-09-15得票数 1

1回答

使用GloVe获取最相似的单词

nlp、stanford-nlp、word-embedding

在运行演示之后，我得到了一些文件，如vocab、vectors等，但是它们没有任何文档或任何东西来描述我们需要使用哪些文件，以及如何使用这些文件来查找最相似的单词。因此，请帮助我找到GloVe中给出的最相似的单词(使用余弦相似度)？(例如，类似于Gensim word2vec中的word2vec) 请帮帮我!

浏览 4提问于2017-11-18得票数 1

回答已采纳

1回答

如何使用Gensim* doc2vec执行高效的查询？*

python、gensim、similarity、doc2vec、sentence-similarity

我正在用下面的用例研究一个句子相似算法:给定一个新句子，我想从给定的集合中检索它的n个最相似的句子。我正在使用Gensim v.3.7.1，我已经培训了word2vec和doc2vec模型。后者的结果优于word2vec，但我在使用Doc2Vec模型执行高效查询时遇到了困难。该模型使用分布式的单词实现包(dm = 0)。也就是说，我想在我的训练数据集的子集中找到最相似的句子。我的快速修正是用余弦相似

浏览 0提问于2019-05-14得票数 3

回答已采纳

1回答

两种不同Word2Vec模型中单个词余弦相似度的计算

python-3.x、gensim、word2vec、word-embedding

我使用word2vec构建了两个单词嵌入( gensim模型)，并将其保存为(word2vec1和word2vec2)，方法是对两个不同的语料库使用model.save(model_name)命令(这两个语料库有些相似对于这两个cosine-similarity or similarity模型，如何计算提取的顶部单词(如a)的相似度( word2vec )？我想知道，对于两个不同的生成模型，同一个词(a)是否有多大程

浏览 0提问于2018-09-11得票数 1

回答已采纳

4回答

如何计算WordNet中没有出现的英语单词的相似度？

python、nltk、similarity

一种特殊的自然语言实践是使用WordNet计算两个单词之间的相似度。wordnet.synsets("haha")print(haha)我们会得到[] 那么我们就不能考虑它们之间的相似性

浏览 0提问于2016-07-09得票数 6

1回答

使用gensim.downloader训练gensim模型与手动加载时结果不一致

python、gensim、word2vec

我正在尝试理解以下示例中的错误所在。要在文档中描述的“text8”数据集上进行训练，只需执行以下操作： import gensim.downloader as apimodel = Word2Vec(dataset) 这样做可以得到非常好的嵌入向量，通过对单词相似度任务的评估得到了验证。: for l

浏览 128提问于2020-06-24得票数 0

回答已采纳

1回答

doc2vec模型给出了非字典词的准确性吗？

python、gensim、doc2vec

doc2vec模型是否将非字典词与同一词在匹配标准上进行比较？例如。我正在输入'AMDML'，'release‘。这里，AMDML是特定于域的单词。如果我在训练模型中有像'AMDML'，'release'，'process‘或'DML'，'release’这样的句子，它会与相同的单词匹配吗？还是只有‘释放’和‘过程’这样的词在大多数类似的方法中是匹配的？

浏览 1提问于2021-01-23得票数 1

回答已采纳

1回答

相似度矩阵聚类

python、cluster-analysis、data-analysis

我如何在Kmeans或其他聚类模型中输入相似度矩阵？from gensim import corporafrom gensim.models import Word2Vec, WordEmbeddingSimilarityIndexfrom gensim.similarities import SoftCosineSimilarity, SparseTermSim

浏览 3提问于2020-09-01得票数 0

1回答

基于WordNet的语义相似度矩阵

python、nlp、information-retrieval、wordnet、word-sense-disambiguation

在一些方法中，我发现对于查询中的每个单词，它的前k个同义词(通常是k=3)都会增加到查询中。但是，我使用的是基于TFIDF文档表示的向量空间模型，因此向查询中添加不在词汇表中的单词最终会被删除。而且，由于不会使用词义消除歧义技术，因此添加同义词将不能保证所添加的同义词保留查询中的单词的含义，从而导致查询漂移。因此，我正在考虑创建一个词义相似度矩阵，它将包括查询和所有可能的词义之间的相似度得分，其中词

浏览 43提问于2021-06-30得票数 0

1回答

如何从同现(二元语法)计数列表中训练word2vec？

python、gensim、word2vec

我正在尝试使用训练word2vec模型，方法是使用语料库作者提供的中预先计算的二元语法计数共现计数。如何使用实现这一点

浏览 0提问于2020-03-12得票数 1

1回答

如何在tensorflow_word2vec中找到与某个单词相似的单词，比如在gensim中使用model.most_similar？

tensorflow、word2vec

我已经使用tensorflow构建了word2vec模型，参考这里：我的问题是，我如何找到某个单词的前n个相似的单词。我知道在gensim中，我可以保存并加载word2vec模型，然后使用model.most_similar来查找我在tensorflow中的want.but方式，甚至还有什么方法可以在tensorflow中保存模型，因为我发现我得到的只是一个嵌入向量，对吗？

浏览 1提问于2016-12-13得票数 0

2回答

什么是映射相似ngram的最佳方法？

python、nlp、nltk

(older_lemma): print(syn)我想的是一种粗糙但快速的相似算法，它可以给我一个粗略的表示，说明两个单词/同步集可能有多近。这样，我就可以消除大多数绝对不同的词，节省时间。我不确定它是否存在

浏览 0提问于2018-08-17得票数 1

2回答

用含python语句的word2vec查找两个句子的相似性

python、nlp

我想用word2vectors来计算两个句子之间的相似度，我试图得到一个句子的向量，这样我就可以计算一个句子向量的平均值来找到余弦相似度。我试过这段代码，但它不起作用。它给句子向量的输出。我想要sentence_1_avg_vector & sentence_2_avg_vector中句子的实际向量。, 'stole', 'Kohinoor', 'KohiNoor', 'diamond', 'back

浏览 0提问于2017-08-24得票数 4

回答已采纳

1回答

词向量和段落向量查询

similarity、gensim、word2vec、temporal、doc2vec

在Gensim的实现中，我试图理解word2vec和doc2vec向量之间的关系。在我的应用程序中，我用相同的标签(主题)标记多个文档，我正在使用dbow_words=1在我的语料库上训练一个dbow_words=1模型，以训练单词向量。问题2:我的其他问题是关于一个词的高/低频频率在最终的word2vec模型中的影响。如果wordA和wordB在文档的特定文档标签(Set)中具有相似的上下文，但是word

浏览 1提问于2016-11-07得票数 0

回答已采纳

3回答

为什么word2vec中的most_similar不考虑术语本身？

python、nlp、gensim、word2vec、similarity

我正在做一个实体相似性项目。word2vec中的most_similar gensim模型在这方面工作得很好。但是，我也希望在结果中包含搜索词本身。它应该是这样的：>>> model = gensim.models.KeyedVectors.load("model.bin另外，如果有像melanoma xyz这样的术语

浏览 0提问于2020-11-12得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么用gensim计算相似度需要字典的大小？

如何用python的gensim word2vec模型计算句子相似度

如何在gensim* word2vec模型中寻找二元语法相似度*

如何用word2vec计算出两个词的相似距离？

如何使用Word2Vec计算句子相似度得分

使用预训练的Bert，Elmo获得两个单词之间的相似度分数

使用GloVe获取最相似的单词

如何使用Gensim* doc2vec执行高效的查询？*

两种不同Word2Vec模型中单个词余弦相似度的计算

如何计算WordNet中没有出现的英语单词的相似度？

使用gensim.downloader训练gensim模型与手动加载时结果不一致

doc2vec模型给出了非字典词的准确性吗？

相似度矩阵聚类

基于WordNet的语义相似度矩阵

如何从同现(二元语法)计数列表中训练word2vec？

如何在tensorflow_word2vec中找到与某个单词相似的单词，比如在gensim中使用model.most_similar？

什么是映射相似ngram的最佳方法？

用含python语句的word2vec查找两个句子的相似性

词向量和段落向量查询

为什么word2vec中的most_similar不考虑术语本身？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐