在语义网络相似度中评估短文本

、、、、

我有一个评估短文本的程序。它给出一个原始文本，并将其传输到语义网络。然后将其与几个短文本进行比较，这些短文本也被转换为语义网络。使用意义与句子的相似度来衡量原始文本与其余文本之间的相似度。如何在Python中执行这些步骤?可以使用哪些库？有没有现成的代码可以在我的工作中使用？请帮帮忙

浏览 24提问于2020-11-12得票数 0

2回答

如何使用词性来评估语义文本的相似度？

、、、

我正在尝试编写一个程序来评估文本之间的语义相似度。我已经比较了文本之间的n-gram频率(一种词汇测量)。我想要一些不那么肤浅的东西，我认为在句子结构中查看相似度是评估文本相似度的一种方法。然而，我所能做的就是计算词性(例如，每个文本4个名词，2个动词，等等)。然后，这类似于只计算n-gram(实际上不如ngram好)。如何使用

浏览 1提问于2012-07-12得票数 1

2回答

如何在文档中实现语义相似度

我正在做一个项目，在这个项目中，我需要根据搜索查询对文本文档进行排名，但我需要对具有单词或句子的语义相似度的文档进行排名，我无法开始关于如何使用java找到语义相似度。是否有任何链接或论文可以让我开始在文档或任何想法中找到单词的语义相似度。

浏览 3提问于2014-06-25得票数 0

1回答

是否有一个库或框架可以测量短语之间的语义距离？

、、、、

我知道WordNet能够提供两个单词之间的语义距离，但是包含一个以上单词的短语呢？有没有开放的库可以让我测量两个不同短语之间的语义距离？

浏览 0提问于2012-10-22得票数 0

1回答

寻找文本中句子之间的语义连贯性

、、、、

我需要一些帮助写一个程序的基础上，从这些链接和的代码，将自动计算之间的语义相似度a.连续的句子和b.句子由1个中间短语，在和整个文件(1000句子)。提供的代码已经标记化并可以找到语义相似度，但我不知道如何编写新代码来计算(并显示)整个文本(a，b)中连续和“插入”句子之间的语义相似度。.I不想一遍又一遍地做同样的事情。

浏览 13提问于2017-01-11得票数 0

1回答

从单词列表中提取更多相似单词

、

其中一个想法是，我正在尝试查看单词“cat”是否出现在同义词集名称或定义中，以包括或排除这些词条。

浏览 1提问于2015-06-17得票数 3

1回答

wordnet python-nltk接口是否包含任何与语义相关的度量？

、、、

我知道我可以在nltk接口中使用语义相似度 sim=wn.synset(name_1).path_similarity(wn.synset(name_2)) 我还知道我可以使用向量空间模型和共生矩阵来评估单词的语义相关性，但我无法在nltk界面中找到任何解决方案。

浏览 23提问于2020-08-21得票数 1

回答已采纳

1回答

相似性评分在gensim中意味着什么？

、、、

我使用Gensim库来查找句子与段落集合、文本数据集之间的相似之处。分别使用了余弦相似度、软余弦相似度和移动测度。Gensim返回一个项目列表，包括、docid、和相似性评分。对于余弦相似度和软余弦相似度，我猜相似度是向量之间的余弦。我说的对吗？在Gensim文档中，他们写道，这是语义的关联性，没有额外的解释

浏览 0提问于2021-09-20得票数 0

回答已采纳

2回答

我已经在我的自定义数据集上完成了一个预先训练过的语言模型(GPT-2)。我希望有一种方法来评估我的模型生成特定预定义主题的句子的能力，以单个关键字的形式给出。我已经尝试过的是:从LM生成足够多的句子，并将这些句子与目标主题(或主题中的每一个单词，我们有多个单词)之间的平均余弦相似度作为这里描述。我不确定这是否是一种有效的方法，而且句子之间的余弦相似性在很多情况下也会产生很差的结果。提前感谢您的帮助。

浏览 0提问于2020-10-02得票数 2

回答已采纳

1回答

预测连续值输出

、、

我正在研究预测两个文本之间的语义文本相似度(SemEval 2017任务-1)。相似度得分(输出)是0,5之间的连续值。因此，神经网络模型(链接如下)在最后一层具有6个单元，用于值0,5之间的预测。

浏览 0提问于2018-04-10得票数 0

1回答

用相似算法python识别两个句子之间的缺失词

、、、

总的来说，我想做的是:给定两个句子A和B，我想知道B中的哪些词在语义上与A中的词完全不同。本质上，我需要计算两个句子之间的相似度，找出哪个单词(来自B)的相似度很低，然后打印出来。我计算了余弦相似度，但没有给出多少关于矩阵相似性的信息。让我们说A=“肺癌是一种恶性肿瘤”而B=“肺癌是一种肺部疾病”，由于疾病和肿瘤在语义上是相似的，所以A

浏览 3提问于2022-02-20得票数 1

1回答

如何计算TF-IDF

、

我想使用TF-IDF的余弦相似度方法来得到两个单词的语义相似度。首先，我想从wikipedia或word- text中提取这些单词的含义，然后对文本进行预处理并找到TF-IDF。当我在谷歌上搜索这个问题时，我发现为了找到TF-IDF，我们应该有一个训练集和测试集。在我的例子中，哪个是训练集，哪个是测试集？如何使用计算结果计算余弦相似度？

浏览 3提问于2012-10-06得票数 1

回答已采纳

4回答

使用Microsoft Cognitive Services查找相似项目

是最好的，也是最少的工作，用来解决查找给定文章的相似文章的问题。文章是一串文本。假设我没有关于文章的用户交互数据。

浏览 2提问于2016-07-01得票数 0

1回答

暹罗网络与语义相似性(可能是gensim)

、、、、

我想了解暹罗人的网络。在此中，向量是为对象(如图像)计算的，距离度量(例如曼哈顿)应用于神经网络(S)产生的两个向量。这一想法主要应用于互联网上提供的教程中的图像。如果我将它与Gensim语义相似度进行比较，我们也有两个对象(单词或句子)的向量，然后做一个余弦相似度来计算差异。(记得国王-男人+女人=女王的例子)。我是不是错过了暹罗网络的某些方面，或者说它们实际上是一样的？

浏览 0提问于2019-10-23得票数 1

1回答

利用潜在Dirichlet分配(LDA)或命名实体确定文档的新颖性/相似性

、、、、

给定一个包含大量(短)文档(大约100万)的索引或数据库，我试图对每个新传入的文档进行某种新奇的检测。我知道，我必须计算新文档与索引中每个文档的相似性。如果相似度低于某一阈值，则可以将此文档视为新颖的文档。我想要做的一种常见方法是使用向量空间模型并计算余弦相似度(例如，使用Apache )。我已经训练了一个使用Mallet的LDA主题模型，我也能够在语料库上进行命名实体识别。但我不知道如何使用这些主题和命名实体来实现新颖性检测。更具体地说，我不知道如

浏览 0提问于2017-03-12得票数 1

1回答

如何在文本域的弹性搜索查询中进行基于余弦相似度的语义搜索？

、、、、

我正在一个文本字段(技能)上进行匹配。我不想要精确的匹配，相反，我想要基于领域的余弦相似性搜索。如何包含某种语义搜索(基于技能字段的查询中的余弦相似度)。技能字段是一个自由的文本字段，所以我也希望根据它们的语义进行匹配。例如--技能-Communication &交谈应该反映出某种相似之处并提高分数。

浏览 3提问于2022-10-06得票数 0

1回答

如何计算短文本语料库的语义相似度？

、、

在两个短文本语料库之间进行无监督语义相似度比较的正确方法是什么？比较两者的LDA主题分布似乎不是一种解决方案，因为对于较短的文档，生成的主题并不能很好地掌握语义。例如，在这些语料库中创建文档TF-IDF之间的余弦相似性矩阵是一种好方法吗？

浏览 0提问于2020-04-20得票数 0

2回答

计算R中两个词的余弦相似度？

、、、

我有一个文本文件，并希望为文件中的每个单词创建语义向量。然后，我想提取大约500对单词的余弦相似度。在R中做这件事的最好包是什么？

浏览 0提问于2018-01-17得票数 1

回答已采纳

1回答

在keras中结合使用Gensim Fasttext模型和LSTM nn

、、、、

我已经用Gensim在非常短的句子(最多10个单词)语料库上训练了快速文本模型。我知道我的测试集中包含不在我的训练语料库中的单词，即我的语料库中的一些单词，如“催产素”、“来曲霉素”、"Ematrophin“、”Betaxitocin“。给定测试集中的一个新词，fasttext非常清楚地知道通过使用字符级n-gram来生成与训练集中的其他相似词具有很高余弦相似度的向量如何将快速文本模型合并到LSTM keras网络

浏览 25提问于2020-07-06得票数 4

回答已采纳

2回答

句子语义相似度和频度

、、

我有一组逐字逐句的句子，我试着做的是....if两个句子有相同的意思，这些句子应该被原来的句子替换，然后我必须计算这些句子的频率。

浏览 1提问于2018-05-02得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用词性来评估语义文本的相似度？

如何在文档中实现语义相似度

是否有一个库或框架可以测量短语之间的语义距离？

寻找文本中句子之间的语义连贯性

从单词列表中提取更多相似单词

wordnet python-nltk接口是否包含任何与语义相关的度量？

相似性评分在gensim中意味着什么？

特定主题语言模型的评价

预测连续值输出

用相似算法python识别两个句子之间的缺失词

如何计算TF-IDF

使用Microsoft Cognitive Services查找相似项目

暹罗网络与语义相似性(可能是gensim)

利用潜在Dirichlet分配(LDA)或命名实体确定文档的新颖性/相似性

如何在文本域的弹性搜索查询中进行基于余弦相似度的语义搜索？

如何计算短文本语料库的语义相似度？

计算R中两个词的余弦相似度？

在keras中结合使用Gensim Fasttext模型和LSTM nn

句子语义相似度和频度

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐