腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(368)
视频
沙龙
1
回答
为什么用
gensim
计算
相似
度
需要字典的大小?
python
、
nlp
、
gensim
为了使用
gensim
.similarities.docsim.Similarity类计算单词之间的
相似
度
,需要提供语料库和字典的大小。 在我的例子
中
,语料库是使用
word2vec
模型
计算的词向量。我想知道为什么
gensim
需要这么大的字典?另外,如果这里需要用于创建
word2vec
模型
的字典的大小,或者语料库的字典的大小,我想要计算其
相似
度
。
浏览 0
提问于2020-06-23
得票数 0
14
回答
如何用python的
gensim
word2vec
模型
计算句子
相似
度
python
、
gensim
、
word2vec
根据,我可以使用
gensim
软件包
中
的
word2vec
模型
来计算两个词之间的
相似
度
。例如:0.73723527 然而,
word2vec
模型
无法预测句子的
相似
性。在
gensim
中
,我发现了具有句子
相似
性的LSI
模型
,但这似乎不能与
wo
浏览 13
提问于2014-03-02
得票数 144
回答已采纳
1
回答
如
何在
gensim
word2vec
模型
中
寻找
二元
语法
相似
度
machine-learning
、
nlp
、
gensim
、
word2vec
这里我有一个新闻
模型
,假设我使用google-
word2vec
-300
模型
import
gensim
.downloader as api word2vec_model300 = api.load('word2vec-google-news-300') 我想为"AI“或"artifical intelligence”找到
相似
的单词,所以我想写 word2vec_model300.most_similar("artifical intelligence&
浏览 47
提问于2021-11-10
得票数 2
回答已采纳
5
回答
如何用
word2vec
计算出两个词的
相似
距离?
word2vec
Word2vec
是一个开源工具,用于计算谷歌提供的单词距离。它可以通过输入一个单词并根据
相似
度
输出排序的单词列表来使用。例如。germany 0.563291然而,我需要做的是通过给出两个单词来计算
相似
距离
浏览 2
提问于2014-02-24
得票数 46
回答已采纳
2
回答
如何使用
Word2Vec
计算句子
相似
度
得分
nlp
、
gensim
、
word2vec
我是NLP的新手,如何找到两个句子之间的
相似
度
,以及如何打印每个单词的分数。以及如何实现
gensim
word2Vec
模型
。试试这个代码:下面是我的两句话:sentence2=" I am going to Bharat"import numpy as np words1 = sentence
浏览 0
提问于2019-06-29
得票数 0
1
回答
使用预训练的Bert,Elmo获得两个单词之间的
相似
度
分数
nlp
、
gensim
、
word2vec
、
word-embedding
、
elmo
我正在尝试使用预训练的维基
模型
来比较Glove,Fasttext,Bert,Elmo在两个单词之间的
相似
度
。Glove和Fasttext有预训练的
模型
,可以很容易地与python
中
的
gensim
word2vec
一起使用。Elmo和Bert有这样的
模型
吗?
浏览 74
提问于2019-09-15
得票数 1
1
回答
使用GloVe获取最
相似
的单词
nlp
、
stanford-nlp
、
word-embedding
在运行演示之后,我得到了一些文件,
如
vocab、vectors等,但是它们没有任何文档或任何东西来描述我们需要使用哪些文件,以及如何使用这些文件来查找最
相似
的单词。因此,请帮助我找到GloVe
中
给出的最
相似
的单词(使用余弦
相似
度
)?(例如,类似于
Gensim
word2vec
中
的
word2vec
) 请帮帮我!
浏览 4
提问于2017-11-18
得票数 1
回答已采纳
1
回答
如何使用
Gensim
doc2vec执行高效的查询?
python
、
gensim
、
similarity
、
doc2vec
、
sentence-similarity
我正在用下面的用例研究一个句子
相似
算法:给定一个新句子,我想从给定的集合
中
检索它的n个最
相似
的句子。我正在使用
Gensim
v.3.7.1,我已经培训了
word2vec
和doc2vec
模型
。后者的结果优于
word2vec
,但我在使用Doc2Vec
模型
执行高效查询时遇到了困难。该
模型
使用分布式的单词实现包(dm = 0)。也就是说,我想在我的训练数据集的子集中找到最
相似
的句子。我的快速修正是用余弦
相似
浏览 0
提问于2019-05-14
得票数 3
回答已采纳
1
回答
两种不同
Word2Vec
模型
中
单个词余弦
相似
度
的计算
python-3.x
、
gensim
、
word2vec
、
word-embedding
我使用
word2vec
构建了两个单词嵌入(
gensim
模型
),并将其保存为(word2vec1和word2vec2),方法是对两个不同的语料库使用model.save(model_name)命令(这两个语料库有些
相似
对于这两个cosine-similarity or similarity
模型
,如何计算提取的顶部单词(
如
a)的
相似
度
(
word2vec
)?我想知道,对于两个不同的生成
模型
,同一个词(a)是否有多大程
浏览 0
提问于2018-09-11
得票数 1
回答已采纳
4
回答
如何计算WordNet
中
没有出现的英语单词的
相似
度
?
python
、
nltk
、
similarity
一种特殊的自然语言实践是使用WordNet计算两个单词之间的
相似
度
。wordnet.synsets("haha")print(haha)我们会得到[] 那么我们就不能考虑它们之间的
相似
性
浏览 0
提问于2016-07-09
得票数 6
1
回答
使用
gensim
.downloader训练
gensim
模型
与手动加载时结果不一致
python
、
gensim
、
word2vec
我正在尝试理解以下示例
中
的错误所在。要在文档
中
描述的“text8”数据集上进行训练,只需执行以下操作: import
gensim
.downloader as apimodel =
Word2Vec
(dataset) 这样做可以得到非常好的嵌入向量,通过对单词
相似
度
任务的评估得到了验证。: for l
浏览 128
提问于2020-06-24
得票数 0
回答已采纳
1
回答
doc2vec
模型
给出了非字典词的准确性吗?
python
、
gensim
、
doc2vec
doc2vec
模型
是否将非字典词与同一词在匹配标准上进行比较? 例如。我正在输入'AMDML','release‘。这里,AMDML是特定于域的单词。如果我在训练
模型
中有像'AMDML','release','process‘或'DML','release’这样的句子,它会与相同的单词匹配吗?还是只有‘释放’和‘过程’这样的词在大多数类似的方法
中
是匹配的?
浏览 1
提问于2021-01-23
得票数 1
回答已采纳
1
回答
相似
度
矩阵聚类
python
、
cluster-analysis
、
data-analysis
我如
何在
Kmeans或其他聚类
模型
中
输入
相似
度
矩阵?from
gensim
import corporafrom
gensim
.models import
Word2Vec
, WordEmbeddingSimilarityIndexfrom
gensim
.similarities import SoftCosineSimilarity, SparseTermSim
浏览 3
提问于2020-09-01
得票数 0
1
回答
基于WordNet的语义
相似
度
矩阵
python
、
nlp
、
information-retrieval
、
wordnet
、
word-sense-disambiguation
在一些方法
中
,我发现对于查询
中
的每个单词,它的前k个同义词(通常是k=3)都会增加到查询
中
。但是,我使用的是基于TFIDF文档表示的向量空间
模型
,因此向查询
中
添加不在词汇表
中
的单词最终会被删除。而且,由于不会使用词义消除歧义技术,因此添加同义词将不能保证所添加的同义词保留查询
中
的单词的含义,从而导致查询漂移。因此,我正在考虑创建一个词义
相似
度
矩阵,它将包括查询和所有可能的词义之间的
相似
度
得分,其中词
浏览 43
提问于2021-06-30
得票数 0
1
回答
如何从同现(
二元
语法
)计数列表
中
训练
word2vec
?
python
、
gensim
、
word2vec
我正在尝试使用训练
word2vec
模型
,方法是使用语料库作者提供的
中
预先计算的
二元
语法
计数共现计数。 如何使用实现这一点
浏览 0
提问于2020-03-12
得票数 1
1
回答
如
何在
tensorflow_word2vec中找到与某个单词
相似
的单词,比如在
gensim
中使用model.most_similar?
tensorflow
、
word2vec
我已经使用tensorflow构建了
word2vec
模型
,参考这里: 我的问题是,我如何找到某个单词的前n个
相似
的单词。我知道在
gensim
中
,我可以保存并加载
word2vec
模型
,然后使用model.most_similar来查找我在tensorflow
中
的want.but方式,甚至还有什么方法可以在tensorflow中保存
模型
,因为我发现我得到的只是一个嵌入向量,对吗?
浏览 1
提问于2016-12-13
得票数 0
2
回答
什么是映射
相似
ngram的最佳方法?
python
、
nlp
、
nltk
(older_lemma): print(syn)我想的是一种粗糙但快速的
相似
算法,它可以给我一个粗略的表示,说明两个单词/同步集可能有多近。这样,我就可以消除大多数绝对不同的词,节省时间。我不确定它是否存在
浏览 0
提问于2018-08-17
得票数 1
2
回答
用含python语句的
word2vec
查找两个句子的
相似
性
python
、
nlp
我想用word2vectors来计算两个句子之间的
相似
度
,我试图得到一个句子的向量,这样我就可以计算一个句子向量的平均值来找到余弦
相似
度
。我试过这段代码,但它不起作用。它给句子向量的输出。我想要sentence_1_avg_vector & sentence_2_avg_vector
中
句子的实际向量。, 'stole', 'Kohinoor', 'KohiNoor', 'diamond', 'back
浏览 0
提问于2017-08-24
得票数 4
回答已采纳
1
回答
词向量和段落向量查询
similarity
、
gensim
、
word2vec
、
temporal
、
doc2vec
在
Gensim
的实现
中
,我试图理解
word2vec
和doc2vec向量之间的关系。在我的应用程序
中
,我用相同的标签(主题)标记多个文档,我正在使用dbow_words=1在我的语料库上训练一个dbow_words=1
模型
,以训练单词向量。问题2:我的其他问题是关于一个词的高/低频频率在最终的
word2vec
模型
中
的影响。如果wordA和wordB在文档的特定文档标签(Set)
中
具有
相似
的上下文,但是word
浏览 1
提问于2016-11-07
得票数 0
回答已采纳
3
回答
为什么
word2vec
中
的most_similar不考虑术语本身?
python
、
nlp
、
gensim
、
word2vec
、
similarity
我正在做一个实体
相似
性项目。
word2vec
中
的most_similar
gensim
模型
在这方面工作得很好。但是,我也希望在结果
中
包含搜索词本身。它应该是这样的:>>> model =
gensim
.models.KeyedVectors.load("model.bin另外,如果有像melanoma xyz这样的术语
浏览 0
提问于2020-11-12
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用线性规划去计算句子之间的相似度
用Python实现词嵌入的数值化:从文本到向量的转换方法解析
斯坦福大学—自然语言处理中的深度学习
基于word2vec训练词向量(二)
Word embedding系列(二):word2vec详解
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券