腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
文档
相似
性-多个
文档
以相同
的
相似
性评分结束
nlp
我一直在处理一个业务问题,需要找到
与
现有
文档
相似
的新
文档
。我使用了如下各种方法2.TFIDF +
余弦
相似
他们都
没有
像预期
的
那样工作。最后,我发现了一种更好
的
方法--
Word2vec
+软
余弦
相似
性。 但新
浏览 1
提问于2020-04-16
得票数 0
1
回答
与
word2vec
的
余弦
相似
度
没有
给出
良好
的
文档
相似
度
nlp
为什么词嵌入
的
余弦
相似
度
不能提供
良好
的
output...Its,因为high..eventhough
给出
了新
文档
与
大多数历史
文档
的
相似
值,这两个
文档
并不
相似
浏览 9
提问于2020-04-19
得票数 0
3
回答
Python:检查句子中是否包含列表中
的
任何单词(带有模糊匹配)
python
、
text-mining
、
fuzzy-search
我想从给定一个list_of_keywords
的
句子中提取关键字。我设法提取出准确
的
单词是否可以提取
与
给定
的
list_of_keywords具有
良好
相似
性
的
单词,即两个单词之间
的
余弦
相似
度
大于0.8“她
浏览 3
提问于2019-02-21
得票数 2
回答已采纳
1
回答
word2vec
的
余弦
相似
性大于1
python
、
apache-spark
、
pyspark
我使用spark
的
word2vec
算法来计算文本
的
文档
向量。w2vmodel.findSynonyms('science',4).show(5)| wordneuroscience|1.4968051528391833| | psychology|
浏览 0
提问于2016-12-29
得票数 6
1
回答
使用GloVe获取最
相似
的单词
nlp
、
stanford-nlp
、
word-embedding
我是GloVe
的
新手。我在他们
的
网站上成功地运行了他们
的
。在运行演示之后,我得到了一些文件,如vocab、vectors等,但是它们
没有
任何
文档
或任何东西来描述我们需要使用哪些文件,以及如何使用这些文件来查找最
相似
的单词。因此,请帮助我找到GloVe中
给出
的
最
相似
的单词(使用
余弦
相似
度
)?(例如,类似于Gensim
word2vec
中
的
w
浏览 4
提问于2017-11-18
得票数 1
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
python
、
text
、
gensim
、
sentence-similarity
我使用Gensim库来查找句子
与
段落集合、文本数据集之间
的
相似
之处。分别使用了
余弦
相似
度
、软
余弦
相似
度
和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于
余弦
相似
度
和软
余弦
相似
度
,我猜
相似
度
是向量之间
的
余弦
。我说<
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
1
回答
为什么好词嵌入是从最大程度
的
余弦
相似
性产生
的
呢?
neural-network
、
nlp
、
word2vec
、
word-embeddings
我了解
word2vec
的
技术细节。据我所知,一个特定嵌入
的
好处是在浅薄
的
任务中看到
的
,比如单词类比。我无法理解最大程度
的
余弦
相似
度
与
好
的
词嵌入之间
的
关系。
浏览 0
提问于2018-01-25
得票数 4
1
回答
Python3,
word2vec
,我如何在我
的
模型中获得关于“价格”
的
相似
等级列表?
python
、
gensim
、
word2vec
、
similarity
、
cosine-similarity
在gensim
的
价格python中,我想获得“
word2vec
”
的
余弦
相似
度
列表。我读了gensim
word2vec
的
文档
,但
文档
中描述了most_similar和n_similarity函数)() 我想要价格和所有其他价格之间
的
相似
性
的
完整列表。
浏览 7
提问于2019-09-17
得票数 0
回答已采纳
1
回答
关于
word2vec
most_similar()函数
text-mining
、
gensim
、
word2vec
我使用如下
的
most_similar()方法来获取
与
给定单词
相似
的所有单词:AFAIK,它
的
作用是计算给定单词和字典中所有其他单词之间
的
余弦
相似
度
。当我检查单词和分数时,我可以看到列表中有负分数
的
单词。这是什么意思?它们是
与
给定单词具有相反含义
的
单词吗? 另外,如果它
浏览 2
提问于2016-01-19
得票数 5
1
回答
Spark MLLib
的
Word2Vec
余弦
相似
度
大于1
machine-learning
、
word2vec
、
neuroscience
在
word2vec
的
spark实现上,由于某些原因,当迭代或数据分区
的
数量大于1时,
余弦
相似
度
大于1。 据我所知,
余弦
相似
度
应该总是-1 < cos < 1。有人知道为什么吗?
浏览 1
提问于2015-10-27
得票数 5
1
回答
R中
word2vec
模型
余弦
相似
度
的
计算
r
、
word2vec
、
word-embedding
、
cosine-similarity
我正在使用R中
的
软件包"
word2vec
“模型,遇到了一个巨大
的
问题。我想弄清楚哪个词是
与
“不确定性”和“经济”最接近
的
同义词,就像阿兹凯塔-伽瓦尔顿(2020)
的
论文:“欧元区
的
经济政策不确定性:一种无监督
的
机器学习方法”.So I使用
word2vec
包
的
word2vec
用函数预测(对象,.)我可以创建一个表,向我显示与我考虑
的
words.The问题最接近
的</
浏览 3
提问于2021-04-15
得票数 0
回答已采纳
1
回答
文字袋
与
word2vec
澄清
nlp
、
word2vec
我有
文档
,我用
word2vec
为我
的
语料库中
的
所有术语计算单词向量。现在我如何计算向量序列之间
的
相似
性?计算平均向量之间
的
余弦
相似
度
? 还是有更好
的
方法来计算两个袋子之间
的
相似
性?
浏览 0
提问于2018-03-04
得票数 0
2
回答
计算句子集合之间
的
语义
相似
度
nlp
、
word2vec
、
tf-idf
、
cosine-similarity
、
sentence-similarity
我有两组短消息,我想计算这两组短消息之间
的
相似
度
,并根据它们
的
语义
相似
度
来识别它们是否在谈论相同
的
子主题。我知道如何使用成对
相似
度
,我
的
问题是我想计算两个集合中所有句子之间
的
总体
相似
度
,而不是两个句子
的
相似
度
。有
没有
办法使用tf-idf或带有
余弦
相似
浏览 4
提问于2019-08-02
得票数 0
1
回答
当
Word2Vec
使用点积
相似
性进行训练时,为什么还要使用
余弦
相似
性
nlp
、
word2vec
、
cosine-similarity
、
word-embedding
、
dot-product
根据我在stackoverflow上找到
的
几篇文章(例如这个Why does
word2Vec
use cosine similarity?),在我们训练了一个
word2vec
( CBOW或Skip-gram)模型之后,计算两个词向量之间
的
余弦
相似
度
是一种常见
的
做法。然而,这对我来说似乎有点奇怪,因为该模型实际上是用点积作为
相似
度
分数进行训练
的
。这一点
的
一个证据是,我们在训练后得
浏览 132
提问于2019-01-29
得票数 7
2
回答
我可以获得
Word2Vec
和Doc2Vec矩阵来计算
余弦
相似
度
吗?
python
、
gensim
、
word2vec
、
doc2vec
我正在处理文本数据,目前我已经将我
的
数据放入术语
文档
矩阵中,并计算出TF,术语频率和TF-IDF,术语频率
与
文档
频率相反。从这里看,我
的
矩阵如下所示:行名=单词我不清楚我是否有像TF和TF-IDF中那样
的
词嵌入。我希望使用
浏览 3
提问于2019-07-11
得票数 0
1
回答
为什么我得到
的
余弦
相似
度
结果与库结果不同?
python
、
nlp
、
cosine-similarity
、
edit-distance
我尝试使用
余弦
距离()来计算两个单词
的
相似
度
。definition of cosine distance we have当我调用时,
相似
度
为0.1889822365046136: cosdis(
word2vec
('tahu') ,
word2vec
('tempe'
浏览 13
提问于2020-05-14
得票数 0
1
回答
如何预测给定句子
的
语法是否正确?
python
、
nlp
、
prediction
、
word2vec
、
language-model
我正在尝试创建一个预测模型,该模型通过检查句子中单词
的
顺序来判断给定句子是否正确。该模型检查特定
的
单词序列是否已经出现在巨大
的
语料库中,是否有意义。我尝试用
word2vec
模型来做这件事,去掉了两个句子
的
余弦
相似
度
或WMD距离,但这只
给出
了基于词向量
相似
度
的
相似
度
,而不是单词
的
序列。因此,如果我们将输入作为两个句子: 句子1-“
浏览 15
提问于2019-04-10
得票数 0
2
回答
python手套
相似
性度量计算
python
、
similarity
、
cosine-similarity
它是用
余弦
相似
吗?我知道,从gensim
的
word2vec
中,most_similar方法用
余弦
距离来计算
相似
度
。
浏览 1
提问于2016-10-31
得票数 4
回答已采纳
1
回答
是否标准化word向量和
文档
向量之间
的
相似
性?
vector
、
compare
、
similarity
、
word2vec
、
doc2vec
余弦
相似
度
被广泛用于度量两个向量之间
的
相似
性,其中两个向量可以是单词向量或
文档
向量。。当两个向量之间
的
余弦
浏览 2
提问于2018-05-15
得票数 0
2
回答
了解
word2vec
文本表示
nlp
、
word2vec
我想在我
的
程序中实现
word2vec
的
distance部分。不幸
的
是,它不是用C/C++或Python编写
的
,但首先我不理解非二进制表示法。这就是我获取文件./
word2vec
-train text8-phrase -output vectorsphrase.txt -cbow 0 -size 300 -window 10 -negative 0 -hs1 -sample 1e-3 -threads 12 -binary 0
的
方法 当我检查法国<e
浏览 3
提问于2014-04-16
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用 word2vec 计算两个句子之间的相似度?
基于深度学习的短文本相似度学习与行业测评
基于机器学习的文档相似度算法来构建个性化智能文章推荐系统
深度学习第45讲:GloVe词向量与相关应用
拍照时怎样摆姿势好看?前端玩转AI之posenet指南
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券