文本相似度 - 腾讯云开发者社区

、、、、

我想研究同一年内的文本相似度，而不是整个数据集中的相似度。为了找到最相似的文本，我使用了WM距离相似度。对于两个文本将是： word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300distance = word2vec_model.wmdistance("stri

浏览 19提问于2020-11-01得票数 1

回答已采纳

1回答

相似性评分在gensim中意味着什么？

、、、

我使用Gensim库来查找句子与段落集合、文本数据集之间的相似之处。分别使用了余弦相似度、软余弦相似度和移动测度。Gensim返回一个项目列表，包括、docid、和相似性评分。对于余弦相似度和软余弦相似度，我猜相似度是向量之间的余弦。我说的对吗？在Gensim文档中，他们写道，这是语义的关联性，没有额外的解释。我已经搜索了很多，但没有找到任何答案。有什么帮助吗？

浏览 0提问于2021-09-20得票数 0

回答已采纳

1回答

Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)

我使用elasticsearch来组合不同的东西：-基于密集向量(余弦相似度)的文本得分搜索。我的问题是，在查询阶段不计算余弦相似度，我在文本中的搜索充当预筛选器。我将始终获得结果链接到文本搜索，即使余弦相似更好。我想在查询时计算余弦相似度，这个分数将与<

浏览 1提问于2020-01-29得票数 1

回答已采纳

2回答

用于检查两个文本之间相似度百分比的MySQL函数

、

我需要检查通过表格提交的文本与MySQL数据库中存储的一些文本之间的相似性百分比的MySQL代码。TABLE - Articles id, article_body, a

浏览 41提问于2011-10-12得票数 7

1回答

基于word2vev的句子相似度研究

、、

基本上，我想知道的是一个特定的句子/文档与我的训练语料库有多相似。假设我有一个训练语料库，里面充满了关于狗的文本。如果我想检查“飞机有100个座位”这句话与训练语料库的相似度，我希望输出一个低相似度分数。

浏览 12提问于2019-08-09得票数 0

2回答

如何在文档中实现语义相似度

我正在做一个项目，在这个项目中，我需要根据搜索查询对文本文档进行排名，但我需要对具有单词或句子的语义相似度的文档进行排名，我无法开始关于如何使用java找到语义相似度。是否有任何链接或论文可以让我开始在文档或任何想法中找到单词的语义相似度。

浏览 3提问于2014-06-25得票数 0

1回答

Python多进程和NLTK wordnet路径相似性

、、、、

我正在使用多处理池来加速文本语料库上的标题提取过程。在代码的一个阶段，我使用wordnet路径相似度模块来确定两个单词的相似度。如果我按顺序运行我的代码，即不使用多进程池，我会得到计算该路径相似度的正常时间。但是，当我使用多处理来同时处理多个文档时，我观察到与顺序相比，在计算此路径相似度时存在很大的时间延迟。

浏览 1提问于2019-01-15得票数 0

1回答

如何匹配来自不同eCommerce来源的产品？提取产品属性

、、、、

而且，不同类别的产品属性是不同的，而不是相似的。我正在努力寻找解决方案，这将适用于各种产品。大多数文本分类方法是对类别进行分类，而不是提取属性。来自不同站点的产品标题示例。

浏览 0提问于2018-06-05得票数 1

回答已采纳

1回答

一种层次结构的相似度算法

、、

在Android术语中有一个屏幕层次结构(以文本形式)。任务是获取屏幕的“指纹”，以便稍后识别。结构可能变化不大，所以在百分比上获得相似度是很好的。有没有针对层次结构的相似度算法？或者我应该使用字符串相似度算法？

浏览 54提问于2019-06-24得票数 0

回答已采纳

1回答

使用序列匹配器比较文本相似性:为什么小写和大写字符串的结果不同？

、、、

我在pandas数据框中有一组文本(字母数字)，我想计算成对文本(例如文本1和2、2和3、3和4...)的相似度分数。我正在使用序列匹配器进行计算，并能够获得分数。我认为在将文本转换为小写后，也值得比较它们。我创建了2个分数列来比较结果:分数1=非小写文本对的相似性分数(保留文本的原始大小写)分数2=小写文本对的相似性分数。我预计小写文本对的相似度</e

浏览 0提问于2021-04-05得票数 0

1回答

在语义网络相似度中评估短文本

、、、、

我有一个评估短文本的程序。它给出一个原始文本，并将其传输到语义网络。然后将其与几个短文本进行比较，这些短文本也被转换为语义网络。使用意义与句子的相似度来衡量原始文本与其余文本之间的相似度。

浏览 24提问于2020-11-12得票数 0

1回答

DeepLearning4J - ParagraphVectors:为什么相似性是负面的？

、、、、

我正在做的是在一组文本文档上训练模型，然后计算这些文档之间的相似度。现在，正如参考页面()所说，该工具用来计算相似度的度量是余弦相似度，它应该包含在0到1之间。但是，对于某些文档对，我得到了负分。

浏览 0提问于2016-02-29得票数 0

2回答

nltk.corpus.wordnet的哪个相似度函数适合于查找两个单词的相似度？

、、、、

nltk.corpus.wordnet中的哪个相似度函数适合于查找两个单词的相似度？ lch_similarity()?我想使用一个用于word clustering的函数和用于在大文本中查找相似collocation的yarowsky算法。

浏览 5提问于2011-09-13得票数 5

2回答

如何使用词性来评估语义文本的相似度？

、、、

我正在尝试编写一个程序来评估文本之间的语义相似度。我已经比较了文本之间的n-gram频率(一种词汇测量)。我想要一些不那么肤浅的东西，我认为在句子结构中查看相似度是评估文本相似度的一种方法。然而，我所能做的就是计算词性(例如，每个文本4个名词，2个动词，等等)。然后，这类似于只计算n-gram(实际上不如ngram好)。如何使用词性来“更深”地衡量语义文本的相似性？

浏览 1提问于2012-07-12得票数 1

1回答

查找某些文本文件之间的相似度百分比

、、、、

我用C++编写了一个程序，它根据1到100之间的整数变量v的值序列生成一个文本文件。文本文件格式如下：1 2 3 4 5 4 5 6 7 8 8 4 5 7 1 如何执行相似

浏览 2提问于2016-11-08得票数 0

1回答

如何发现一个文本与另一个文本的部分相似？

、

我们知道如何评估两个完整文本的相似度，例如，通过词移位距离。如何在一个文本中找到与另一个文本相似的片段？

浏览 27提问于2019-04-10得票数 0

1回答

如何抓取语义相似的句子

、、、、

我有一个小的文本数据集，并想从网络上抓取相似的句子。使用Bert相关模型、doc2vec和空间相似度的sentence_transformers软件包进行相似性度量。我将阈值设置为85%，但相似度得分高于阈值的句子并不真正相关。如何用python从web上抓取相似的句子？

浏览 33提问于2020-06-06得票数 1

4回答

使用Microsoft Cognitive Services查找相似项目

是最好的，也是最少的工作，用来解决查找给定文章的相似文章的问题。文章是一串文本。假设我没有关于文章的用户交互数据。

浏览 2提问于2016-07-01得票数 0

1回答

一组文本文档的相似性

、、

我正在寻找一种算法，试图检查2)多个文档(约5000个)之间的相似度我需要相同的，因为我正在尝试评估特定类别下的文本文档/句子是否以任何方式彼此相似。

浏览 2提问于2017-05-16得票数 0

1回答

语义搜索-将文本和图像嵌入结合起来

、、

我有一个关于将文本和图像嵌入到语义搜索中的问题。用例是在一个(B2B)市场上的产品搜索，我们有图像(S)和产品的标题和描述。我想让用户同时搜索图像和文本，但我不知道如何组合它们。我目前的想法是使用剪辑模型嵌入图像，用剪辑/语句转换器模型嵌入文本，将同样的内容应用到查询中，并将两个向量连接起来。如果这两个嵌入都被缩放成单位长度，那么它们应该具有相同的权重，并且对最终的相似性产生相同的影响。但是，我看到这种方法可能是非常有限的，因为我采取两个嵌入，只是将它们粉碎在一起，而不考虑任何细微差别。通过图像和文本</

浏览 0提问于2023-05-08得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在同一时间段内使用WMD进行文本相似度

相似性评分在gensim中意味着什么？

Elasticsearch:在相关评分中使用密集向量上的距离(在查询时)

用于检查两个文本之间相似度百分比的MySQL函数

基于word2vev的句子相似度研究

如何在文档中实现语义相似度

Python多进程和NLTK wordnet路径相似性

如何匹配来自不同eCommerce来源的产品？提取产品属性

一种层次结构的相似度算法

使用序列匹配器比较文本相似性:为什么小写和大写字符串的结果不同？

在语义网络相似度中评估短文本

DeepLearning4J - ParagraphVectors:为什么相似性是负面的？

nltk.corpus.wordnet的哪个相似度函数适合于查找两个单词的相似度？

如何使用词性来评估语义文本的相似度？

查找某些文本文件之间的相似度百分比

如何发现一个文本与另一个文本的部分相似？

如何抓取语义相似的句子

使用Microsoft Cognitive Services查找相似项目

一组文本文档的相似性

语义搜索-将文本和图像嵌入结合起来

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐