腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
余弦
相似
度
影响
python
、
statistics
、
cosine-similarity
我正在
计算
余弦
相似
度
,以了解一些年度趋势,我很好奇是否有一种方法可以看到哪些值对
相似
度
贡献最大?是否有一种影响力
计算
或方法用于
单词
列表(我认为这将是最
相似
的应用程序),可以说列表
中
的哪些
单词
对
相似
度
得分
贡献最大?
浏览 21
提问于2021-07-20
得票数 0
回答已采纳
3
回答
在
python
中
计算
单词
相似
度
得分
python
、
nlp
、
wordnet
、
cosine-similarity
、
sentence-similarity
我试图通过比较主题列表来
计算
书籍的
相似
度
。 需要从0-1之间的2个列表
中
获得
相似
度
分数。holy", "religion", "Christian"] book2_topics = ["god", "Christ", "idol", "Jesus"] 尝试使用wordnet,但不确定如何
计算
分数
浏览 59
提问于2021-04-02
得票数 1
3
回答
python
中
的
单词
聚类列表
python
、
nlp
、
cluster-analysis
、
text-mining
假设我有一个
单词
列表'car','dog','puppy','vehicle',我想把
单词
聚成k组,我希望输出是['car','vehicle','dog','puppy']。我首先
计算
每个成对
单词
的
相似
度
得分
,得到一个4x4矩阵(
在
本例
中
) M,其中Mij是
单词</e
浏览 19
提问于2017-01-31
得票数 5
1
回答
对问答系统NLP的几点建议
nlp
、
artificial-intelligence
、
chatbot
、
question-answering
我正在尝试建立一个问题回答系统,其中我有一组预定义的问题和他们的答案。对于来自用户的任何给定问题,我必须查找类似的问题是否已经存在于预定义的问题中,并发送答案。如果它不存在,它必须回复一个通用响应。任何关于如何使用NLP实现这一点的想法都会非常有帮助。
浏览 2
提问于2020-03-15
得票数 0
2
回答
我可以获得Word2Vec和Doc2Vec矩阵来
计算
余弦
相似
度
吗?
python
、
gensim
、
word2vec
、
doc2vec
我正在处理文本数据,目前我已经将我的数据放入术语文档矩阵
中
,并
计算
出TF,术语频率和TF-IDF,术语频率与文档频率相反。从这里看,我的矩阵如下所示:行名=
单词
我不清楚我是否有像TF和TF-IDF
中
那样的词嵌入。我希望使用Word2Vec/Doc2Vec,
浏览 3
提问于2019-07-11
得票数 0
1
回答
基于WordNet的语义
相似
度
矩阵
python
、
nlp
、
information-retrieval
、
wordnet
、
word-sense-disambiguation
我有一个用于整个文档集合的独特
单词
(不包括停用词)的词汇表。我想执行查询扩展。
在
一些方法
中
,我发现对于查询
中
的每个
单词
,它的前k个同义词(通常是k=3)都会增加到查询
中
。但是,我使用的是基于TFIDF文档表示的向量空间模型,因此向查询
中
添加不在词汇表
中
的
单词
最终会被删除。而且,由于不会使用词义消除歧义技术,因此添加同义词将不能保证所添加的同义词保留查询
中
的
单词
的含义,从而导致查询漂移。因此,我正在考
浏览 43
提问于2021-06-30
得票数 0
2
回答
如何用word2vec找出两个
单词
短语的
相似
度
得分
?
text-mining
、
gensim
、
word2vec
使用word2vec,可以通过以下方式查找单个
单词
的
相似
度
得分
/最
相似
的
单词
model.similarity('man', 'woman')model.most_similar('battery life') model.
浏览 1
提问于2017-02-13
得票数 0
1
回答
使用序列匹配器比较文本
相似
性:为什么小写和大写字符串的结果不同?
python
、
text
、
nlp
、
similarity
我
在
pandas数据框中有一组文本(字母数字),我想
计算
成对文本(例如文本1和2、2和3、3和4...)的
相似
度
分数。 我正在使用序列匹配器进行
计算
,并能够获
得分
数。我认为
在
将文本转换为小写后,也值得比较它们。我创建了2个分数列来比较结果:分数1=非小写文本对的
相似
性分数(保留文本的原始大小写)分数2=小写文本对的
相似
性分数。我预计小写文本对的
相似
度
得分
(
得分
2)
浏览 0
提问于2021-04-05
得票数 0
1
回答
使用Runtime.exec向
Python
进程发送参数的解决方案
java
、
python
、
exec
我的示例代码是
计算
两个
单词
之间的
相似
度
分数。
在
Java
中
,它向
Python
发送两个
单词
,其中查找
得分
。然后,
Python
获得两个参数并打印它们的
相似
度
分数。最后,
在
Java
中
读取
Python
代码的结果。"cat", Process p =
浏览 2
提问于2014-03-03
得票数 1
回答已采纳
2
回答
Word2Vec词汇
相似
性
python
、
machine-learning
、
neural-network
、
nlp
、
word2vec
我
在
大约750k
单词
的文本上运行了一个word2vec算法(
在
删除一些停用的
单词
之前)。使用我的模型,我开始寻找与我选择的特定
单词
最
相似
的
单词
,
相似
度
得分
(对于model.wv.most_similar方法)都超级接近1。最接近的第十个
得分
仍然像.998,所以我觉得我没有得到导致无意义
相似
单词
的
单词
相似
度
之间的
浏览 1
提问于2019-11-27
得票数 0
5
回答
可视化数据和集群
python
、
cluster-analysis
、
visualization
我目前正在编写一个
python
脚本来查找文档之间的
相似
度
。我已经
计算
了每个文档对的
相似
度
得分
,并将它们存储
在
字典
中
。0.67999999999999989,(8313,8316):0.99999999999999989,(8321,8322):0.99999999999999989,(8330,8328):1.0} 我的最终目标是将
相似
的文档聚在一起
相似
度
得分
为0
浏览 2
提问于2010-07-14
得票数 2
1
回答
模糊匹配、置信度评分、C#
c#
、
similarity
、
fuzzy
我试图
计算
一个字符串出现在一个大得多的集合的子集中的信心分数。对我来说,这给了我33.333%的机会,我的输入词是一个匹配的3个词,具有较高的
相似
性
得分
。我想
计算
一下,我有
浏览 2
提问于2012-05-15
得票数 1
回答已采纳
1
回答
如何在
python
中
由图节点的边缘列表生成的向量之间找到余弦
相似
性?
python-3.x
、
vector
、
data-mining
、
cosine-similarity
我想从一个给定的向量嵌入文件中
计算
出一些图节点的余弦
相似
度
分数。现在如何
计算
python
中
每个节点的
得分
?我相信用科学工具-学习,我们能解决这个问题。 1 -> 0.2 3 -> 0.5 . 我很抱歉,如果我不能正确地解释我的问题,因为我是新的数据科学。我可以
在
评论<
浏览 1
提问于2019-07-22
得票数 0
1
回答
哪种类型的自动编码器可以实现文本
相似
性?
neural-network
、
nlp
、
autoencoder
我正在解决以下任务:我想找出句子对之间的
相似
度
得分
。我的想法是为句子
中
的每个
单词
生成嵌入,并将向量提供给编码器,编码器将学习将这些多个输入聚合为一个较低的表示序列向量。并使用该序列向量之间的余弦
相似
度
来找出
相似
度
得分
。我的问题是,对于哪种类型的自动编码器或神经网络架构更适合我的情况,您有什么建议吗?
浏览 3
提问于2019-11-25
得票数 0
1
回答
文字袋与word2vec澄清
nlp
、
word2vec
我有文档,我用word2vec为我的语料库
中
的所有术语
计算
单词
向量。现在我如何
计算
向量序列之间的
相似
性?
计算
平均向量之间的余弦
相似
度
? 还是有更好的方法来
计算
两个袋子之间的
相似
性?
浏览 0
提问于2018-03-04
得票数 0
1
回答
基于关键字数量的文档与其他文档相关的概率
statistics
、
probability
如果用户搜索
单词
"Computer“,并且我想显示基于关键字"Computer”的最相关的文档。我的算法根据关键词
在
文档中出现的次数来选择最相关的文档。唯一的问题是文档X有10个
单词
,"Computer“出现两次,而文档Y有1000个
单词
,"Computer”出现100次。从文档
中
的字数来看,说文档Y比文档X更相关是不正确的。
浏览 8
提问于2016-01-09
得票数 0
3
回答
从字符串列表
中
,如何获得
python
中最奇怪的
单词
/字符串?
python
wabe', 'all', 'mimsy', 'were', 'the', 'borogoves', 'and', 'the', 'mome', 'raths', 'outgrabe'] 如何返回与字符串
中
其他
单词
最不同的
单词
列表-基于与列表中所有其他
单词
的最小
相似
度
和平均
浏览 0
提问于2012-04-12
得票数 1
1
回答
Elasticsearch:
在
相关评分中使用密集向量上的距离(
在
查询时)
elasticsearch
我使用elasticsearch来组合不同的东西:-基于密集向量(余弦
相似
度
)的文本
得分
搜索。我的问题是,
在
查询阶段不
计算
余弦
相似
度
,我
在
文本
中
的搜索充当预筛选器。我将始终获得结果链接到文本搜索,即使余弦
相似
更好。例如,如果一个score
浏览 1
提问于2020-01-29
得票数 1
回答已采纳
1
回答
用
相似
算法
python
识别两个句子之间的缺失词
nlp
、
similarity
、
cosine-similarity
、
sentence-similarity
总的来说,我想做的是:给定两个句子A和B,我想知道B
中
的哪些词
在
语义上与A
中
的词完全不同。本质上,我需要
计算
两个句子之间的
相似
度
,找出哪个
单词
(来自B)的
相似
度
很低,然后打印出来。我
计算
了余弦
相似
度
,但没有给出多少关于矩阵
相似
性的信息。让我们说A=“肺癌是一种恶性肿瘤”而B=“肺癌是一种肺部疾病”, 由于疾病和肿瘤
在
语义上是
相似
浏览 3
提问于2022-02-20
得票数 1
1
回答
STS基准数据集中的语义
相似
度
得分
是如何
计算
的?
python
、
nlp
、
cosine-similarity
、
bert-language-model
这是GitHub存储库:我正在尝试完成的任务:我有另一个自定义数据集,其中也有成对的
相似
和不
相似
句子。(Bert语句转换器:)它的
计算
方式必须与STS基准数据集中句子对的
计算
方式相同。这个帖子非常
浏览 31
提问于2020-02-23
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券