腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5171)
视频
沙龙
1
回答
在
语义
网络
相似
度
中
评估
短
文本
、
、
、
、
我有一个
评估
短
文本
的程序。它给出一个原始
文本
,并将其传输到
语义
网络
。然后将其与几个短
文本
进行比较,这些短
文本
也被转换为
语义
网络
。使用意义与句子的
相似
度
来衡量原始
文本
与其余
文本
之间的
相似
度
。如何在Python
中
执行这些步骤?可以使用哪些库?有没有现成的代码可以
在
我的工作中使用?请帮帮忙
浏览 24
提问于2020-11-12
得票数 0
2
回答
如何使用词性来
评估
语义
文本
的
相似
度
?
、
、
、
我正在尝试编写一个程序来
评估
文本
之间的
语义
相似
度
。我已经比较了
文本
之间的n-gram频率(一种词汇测量)。我想要一些不那么肤浅的东西,我认为
在
句子结构
中
查看
相似
度
是
评估
文本
相似
度
的一种方法。然而,我所能做的就是计算词性(例如,每个
文本
4个名词,2个动词,等等)。然后,这类似于只计算n-gram(实际上不如ngram好)。如何使用
浏览 1
提问于2012-07-12
得票数 1
2
回答
如何在文档
中
实现
语义
相似
度
我正在做一个项目,在这个项目中,我需要根据搜索查询对
文本
文档进行排名,但我需要对具有单词或句子的
语义
相似
度
的文档进行排名,我无法开始关于如何使用java找到
语义
相似
度
。是否有任何链接或论文可以让我开始
在
文档或任何想法中找到单词的
语义
相似
度
。
浏览 3
提问于2014-06-25
得票数 0
1
回答
是否有一个库或框架可以测量短语之间的
语义
距离?
、
、
、
、
我知道WordNet能够提供两个单词之间的
语义
距离,但是包含一个以上单词的短语呢? 有没有开放的库可以让我测量两个不同短语之间的
语义
距离?
浏览 0
提问于2012-10-22
得票数 0
1
回答
寻找
文本
中
句子之间的
语义
连贯性
、
、
、
、
我需要一些帮助写一个程序的基础上,从这些链接和的代码,将自动计算之间的
语义
相似
度
a.连续的句子和b.句子由1个中间短语,
在
和整个文件(1000句子)。提供的代码已经标记化并可以找到
语义
相似
度
,但我不知道如何编写新代码来计算(并显示)整个
文本
(a,b)
中
连续和“插入”句子之间的
语义
相似
度
。.I不想一遍又一遍地做同样的事情。
浏览 13
提问于2017-01-11
得票数 0
1
回答
从单词列表中提取更多
相似
单词
、
其中一个想法是,我正在尝试查看单词“cat”是否出现在同义词集名称或定义
中
,以包括或排除这些词条。
浏览 1
提问于2015-06-17
得票数 3
1
回答
wordnet python-nltk接口是否包含任何与
语义
相关的度量?
、
、
、
我知道我可以
在
nltk接口中使用
语义
相似
度
sim=wn.synset(name_1).path_similarity(wn.synset(name_2)) 我还知道我可以使用向量空间模型和共生矩阵来
评估
单词的
语义
相关性,但我无法
在
nltk界面中找到任何解决方案。
浏览 23
提问于2020-08-21
得票数 1
回答已采纳
1
回答
相似
性评分在gensim中意味着什么?
、
、
、
我使用Gensim库来查找句子与段落集合、
文本
数据集之间的
相似
之处。分别使用了余弦
相似
度
、软余弦
相似
度
和移动测度。Gensim返回一个项目列表,包括、docid、和
相似
性评分。对于余弦
相似
度
和软余弦
相似
度
,我猜
相似
度
是向量之间的余弦。我说的对吗?
在
Gensim文档
中
,他们写道,这是
语义
的关联性,没有额外的解释
浏览 0
提问于2021-09-20
得票数 0
回答已采纳
2
回答
特定主题语言模型的评价
、
、
、
我已经
在
我的自定义数据集上完成了一个预先训练过的语言模型(GPT-2)。我希望有一种方法来
评估
我的模型生成特定预定义主题的句子的能力,以单个关键字的形式给出。我已经尝试过的是:从LM生成足够多的句子,并将这些句子与目标主题(或主题中的每一个单词,我们有多个单词)之间的平均余弦
相似
度
作为这里描述。我不确定这是否是一种有效的方法,而且句子之间的余弦
相似
性
在
很多情况下也会产生很差的结果。 提前感谢您的帮助。
浏览 0
提问于2020-10-02
得票数 2
回答已采纳
1
回答
预测连续值输出
、
、
我正在研究预测两个
文本
之间的
语义
文本
相似
度
(SemEval 2017任务-1)。
相似
度
得分(输出)是0,5之间的连续值。因此,神经
网络
模型(链接如下)
在
最后一层具有6个单元,用于值0,5之间的预测。
浏览 0
提问于2018-04-10
得票数 0
1
回答
用
相似
算法python识别两个句子之间的缺失词
、
、
、
总的来说,我想做的是:给定两个句子A和B,我想知道B
中
的哪些词
在
语义
上与A
中
的词完全不同。本质上,我需要计算两个句子之间的
相似
度
,找出哪个单词(来自B)的
相似
度
很低,然后打印出来。我计算了余弦
相似
度
,但没有给出多少关于矩阵
相似
性的信息。让我们说A=“肺癌是一种恶性肿瘤”而B=“肺癌是一种肺部疾病”, 由于疾病和肿瘤
在
语义
上是
相似
的,所以A
浏览 3
提问于2022-02-20
得票数 1
1
回答
如何计算TF-IDF
、
我想使用TF-IDF的余弦
相似
度
方法来得到两个单词的
语义
相似
度
。首先,我想从wikipedia或word- text中提取这些单词的含义,然后对
文本
进行预处理并找到TF-IDF。当我
在
谷歌上搜索这个问题时,我发现为了找到TF-IDF,我们应该有一个训练集和测试集。
在
我的例子
中
,哪个是训练集,哪个是测试集?如何使用计算结果计算余弦
相似
度
?
浏览 3
提问于2012-10-06
得票数 1
回答已采纳
4
回答
使用Microsoft Cognitive Services查找
相似
项目
是最好的,也是最少的工作,用来解决查找给定文章的
相似
文章的问题。文章是一串
文本
。假设我没有关于文章的用户交互数据。
浏览 2
提问于2016-07-01
得票数 0
1
回答
暹罗
网络
与
语义
相似
性(可能是gensim)
、
、
、
、
我想了解暹罗人的
网络
。在此
中
,向量是为对象(如图像)计算的,距离度量(例如曼哈顿)应用于神经
网络
(S)产生的两个向量。这一想法主要应用于互联网上提供的教程
中
的图像。如果我将它与Gensim
语义
相似
度
进行比较,我们也有两个对象(单词或句子)的向量,然后做一个余弦
相似
度
来计算差异。(记得国王-男人+女人=女王的例子)。我是不是错过了暹罗
网络
的某些方面,或者说它们实际上是一样的?
浏览 0
提问于2019-10-23
得票数 1
1
回答
利用潜在Dirichlet分配(LDA)或命名实体确定文档的新颖性/
相似
性
、
、
、
、
给定一个包含大量(
短
)文档(大约100万)的索引或数据库,我试图对每个新传入的文档进行某种新奇的检测。 我知道,我必须计算新文档与索引
中
每个文档的
相似
性。如果
相似
度
低于某一阈值,则可以将此文档视为新颖的文档。我想要做的一种常见方法是使用向量空间模型并计算余弦
相似
度
(例如,使用Apache )。我已经训练了一个使用Mallet的LDA主题模型,我也能够
在
语料库上进行命名实体识别。但我不知道如何使用这些主题和命名实体来实现新颖性检测。更具体地说,我不知道如
浏览 0
提问于2017-03-12
得票数 1
1
回答
如何在
文本
域的弹性搜索查询中进行基于余弦
相似
度
的
语义
搜索?
、
、
、
、
我正在一个
文本
字段(技能)上进行匹配。我不想要精确的匹配,相反,我想要基于领域的余弦
相似
性搜索。如何包含某种
语义
搜索(基于技能字段的查询
中
的余弦
相似
度
)。技能字段是一个自由的
文本
字段,所以我也希望根据它们的
语义
进行匹配。例如--技能-Communication &交谈应该反映出某种
相似
之处并提高分数。
浏览 3
提问于2022-10-06
得票数 0
1
回答
如何计算短
文本
语料库的
语义
相似
度
?
、
、
在
两个短
文本
语料库之间进行无监督
语义
相似
度
比较的正确方法是什么?比较两者的LDA主题分布似乎不是一种解决方案,因为对于较短的文档,生成的主题并不能很好地掌握
语义
。例如,在这些语料库
中
创建文档TF-IDF之间的余弦
相似
性矩阵是一种好方法吗?
浏览 0
提问于2020-04-20
得票数 0
2
回答
计算R
中
两个词的余弦
相似
度
?
、
、
、
我有一个
文本
文件,并希望为文件
中
的每个单词创建
语义
向量。然后,我想提取大约500对单词的余弦
相似
度
。
在
R
中
做这件事的最好包是什么?
浏览 0
提问于2018-01-17
得票数 1
回答已采纳
1
回答
在
keras
中
结合使用Gensim Fasttext模型和LSTM nn
、
、
、
、
我已经用Gensim
在
非常
短
的句子(最多10个单词)语料库上训练了快速
文本
模型。我知道我的测试集中包含不在我的训练语料库
中
的单词,即我的语料库
中
的一些单词,如“催产素”、“来曲霉素”、"Ematrophin“、”Betaxitocin“。给定测试集中的一个新词,fasttext非常清楚地知道通过使用字符级n-gram来生成与训练集中的其他
相似
词具有很高余弦
相似
度
的向量 如何将快速
文本
模型合并到LSTM keras
网络
浏览 25
提问于2020-07-06
得票数 4
回答已采纳
2
回答
句子
语义
相似
度
和频度
、
、
我有一组逐字逐句的句子,我试着做的是....if两个句子有相同的意思,这些句子应该被原来的句子替换,然后我必须计算这些句子的频率。
浏览 1
提问于2018-05-02
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
语义文本相似度研究进展
谷歌 AI:语义文本相似度研究进展
语义相似度在好大夫搜索的优化探索
通用句子语义编码器,谷歌在语义文本相似性上的探索
基于深度学习的短文本相似度学习与行业测评
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券