句子相似度_句子相似度计算_句子相似度算法 - 腾讯云开发者社区

nlp、word2vec、tf-idf、cosine-similarity、sentence-similarity

我有两组短消息，我想计算这两组短消息之间的相似度，并根据它们的语义相似度来识别它们是否在谈论相同的子主题。我知道如何使用成对相似度，我的问题是我想计算两个集合中所有句子之间的总体相似度，而不是两个句子的相似度。有没有办法使用tf-idf或带有余弦相似度的word2vec/doc2vec来计算总分？

浏览 4提问于2019-08-02得票数 0

1回答

如何预测给定句子的语法是否正确？

python、nlp、prediction、word2vec、language-model

我正在尝试创建一个预测模型，该模型通过检查句子中单词的顺序来判断给定句子是否正确。该模型检查特定的单词序列是否已经出现在巨大的语料库中，是否有意义。我尝试用word2vec模型来做这件事，去掉了两个句子的余弦相似度或WMD距离，但这只给出了基于词向量相似度的相似度，而不是单词的序列。因此，如果我们将输入作为两个句子：句子1-“我要去商店” 句子2-“去我是商店去” 输出应指示<e

浏览 15提问于2019-04-10得票数 0

1回答

句子转换器如何预测新实例

python、nlp、huggingface-transformers、sentence、sentence-similarity

我正在探索句子转换器，并偶然发现了这个。它展示了如何对我们的自定义数据进行培训。但我不知道该怎么预测。如果有两个新句子，如1)这是第三个例子，2)这是第三个例子。我怎么能预测到这些句子有多相似呢？example sentence", "Each sentence is converted"]问题1) 这是一种在训练旧模型和创建新模型之后获得句子嵌入的正确方法吗我很困惑，因为在拟合过程中，我们给出了两个句子</e

浏览 1提问于2022-01-04得票数 2

1回答

如何根据常用词对文本进行分类

python、pandas、nlp、nltk

这个问题是关于基于常用词的文本分类，我不知道我是否正确地处理了这个问题我有一个excel，在"Description“列中有文本，在" ID”列中有一个唯一的ID，我想迭代描述，并根据文本中常见单词的百分比或频率比较它们。我想对描述进行分类，并给它们另一个ID。请参见下面的示例…… import pandas as pd df = pd.DataFrame({'ID': ['12 ', '54'

浏览 21提问于2019-08-22得票数 0

1回答

寻找文本中句子之间的语义连贯性

python、vector、tf-idf、sentence-similarity、latent-semantic-analysis

我需要一些帮助写一个程序的基础上，从这些链接和的代码，将自动计算之间的语义相似度a.连续的句子和b.句子由1个中间短语，在和整个文件(1000句子)。提供的代码已经标记化并可以找到语义相似度，但我不知道如何编写新代码来计算(并显示)整个文本(a，b)中连续和“插入”句子之间的语义相似度。.I不想一遍又一遍地做同样的事情。

浏览 13提问于2017-01-11得票数 0

1回答

如何抓取语义相似的句子

python、nlp、data-science、sentence-similarity、semantic-analysis

我有一个小的文本数据集，并想从网络上抓取相似的句子。使用Bert相关模型、doc2vec和空间相似度的sentence_transformers软件包进行相似性度量。我将阈值设置为85%，但相似度得分高于阈值的句子并不真正相关。如何用python从web上抓取相似的句子？

浏览 33提问于2020-06-06得票数 1

1回答

STS基准数据集中的语义相似度得分是如何计算的？

python、nlp、cosine-similarity、bert-language-model

这是GitHub存储库：我正在尝试完成的任务:我有另一个自定义数据集，其中也有成对的相似和不相似句子。(Bert语句转换器：)它的计算方式必须与STS基准数据集中句子对的计算方式相同。这个帖子非常

浏览 31提问于2020-02-23得票数 0

1回答

对问答系统NLP的几点建议

nlp、artificial-intelligence、chatbot、question-answering

我正在尝试建立一个问题回答系统，其中我有一组预定义的问题和他们的答案。对于来自用户的任何给定问题，我必须查找类似的问题是否已经存在于预定义的问题中，并发送答案。如果它不存在，它必须回复一个通用响应。任何关于如何使用NLP实现这一点的想法都会非常有帮助。

浏览 2提问于2020-03-15得票数 0

2回答

使用tensorflow对句子相似性进行建模

python、machine-learning、tensorflow、deep-learning

我正在尝试使用tensorflow对句子相似度进行建模。理想的做法是，首先将连接的句子馈送到rnn，然后将rnn的输出馈送到softmax，以进行二进制分类，无论相似与否。

浏览 0提问于2016-05-03得票数 7

1回答

欧几里德距离是否衡量语义相似性？

scikit-learn、gensim、euclidean-distance、cosine-similarity、sentence-similarity

我想衡量句子之间的相似度。我可以使用sklearn和欧几里得距离来衡量句子之间的语义相似度吗？我还读到了关于余弦相似性的文章。有人能解释一下它们与度量的区别吗?使用的最佳方法是什么？

浏览 0提问于2018-11-11得票数 2

3回答

句子间的语义相似度

java、nlp

我需要任何开源工具或技术来找到两个句子的语义相似度，其中我给出两个句子作为输入，并接收分数(即语义相似度)作为输出。有什么帮助吗？

浏览 3提问于2010-01-11得票数 8

3回答

如何找到两个文档之间的相似度

python-3.x、spacy

我曾尝试使用spacy的相似度函数来获取文档中的最佳匹配句子。然而，它失败了，因为它认为每个项目符号是一个句子，项目符号是不完整的句子(例如句子1“密码应该是最小的8个字符的长度，句子2的形式是一个项目符号”8个字符“)。它不知道它是指密码，所以我的相似度很低。

浏览 24提问于2019-04-12得票数 0

4回答

是否可以使用Google BERT来计算两个文本文档之间的相似度？

python、text、scikit-learn、nlp、word-embedding

是否可以使用Google BERT来计算两个文本文档之间的相似度？据我所知，BERT的输入应该是有限大小的句子。一些作品使用BERT来计算句子的相似度，例如：是否有BERT done的实现，以便将其用于大型文档而不是句子作为输入(具有数千个单词的文档)？

浏览 1提问于2019-09-11得票数 12

1回答

用词向量表示句子的余弦相似度现在可以衡量词序吗？

nlp、deep-learning

我知道，原始的余弦相似度，当应用于通过特定单词的频率来表示两个文档时，并不衡量词序。我现在看到一大堆论文将余弦相似度应用于由单词向量组成的句子对的表示。我假设他们把每个句子的token# x嵌入长度矩阵展平成一个长向量，它的长度是原始句子的token# x嵌入长度。因此，“我爱你”和“你爱我”(归一化为"I")在这种应用余弦相似性的新方法中不会产生1，而旧方法会产生1。我说的对吗?谢谢你的任何启发性的回答。

浏览 2提问于2016-06-21得票数 1

1回答

一组文本文档的相似性

data-mining、text-mining、sentence-similarity

我正在寻找一种算法，试图检查2)多个文档(约5000个)之间的相似度我需要相同的，因为我正在尝试评估特定类别下的文本文档/句子是否以任何方式彼此相似。

浏览 2提问于2017-05-16得票数 0

1回答

哪种类型的自动编码器可以实现文本相似性？

neural-network、nlp、autoencoder

我正在解决以下任务:我想找出句子对之间的相似度得分。我的想法是为句子中的每个单词生成嵌入，并将向量提供给编码器，编码器将学习将这些多个输入聚合为一个较低的表示序列向量。并使用该序列向量之间的余弦相似度来找出相似度得分。我的问题是，对于哪种类型的自动编码器或神经网络架构更适合我的情况，您有什么建议吗？

浏览 3提问于2019-11-25得票数 0

1回答

基于语义相似性的句子分类

machine-learning、data-mining、clustering

我有一套独特的句子。对于每一个句子，我计算出一个语义相似度分数(0到1之间)，其余的句子，如下面的例子所提到的。., senN}sen1 and sen3 = 0.7......同样，对于所有的句子，我计算成对的语义相似性分数。既然，我得到了一个成对的价值

浏览 0提问于2017-08-11得票数 0

回答已采纳

2回答

句子语义相似度和频度

python、nlp、nltk

我有一组逐字逐句的句子，我试着做的是....if两个句子有相同的意思，这些句子应该被原来的句子替换，然后我必须计算这些句子的频率。有没有办法可以用NLTK来做呢？在这方面的任何建议都是欢迎和赞赏的。

浏览 1提问于2018-05-02得票数 1

1回答

用相似算法python识别两个句子之间的缺失词

nlp、similarity、cosine-similarity、sentence-similarity

总的来说，我想做的是:给定两个句子A和B，我想知道B中的哪些词在语义上与A中的词完全不同。本质上，我需要计算两个句子之间的相似度，找出哪个单词(来自B)的相似度很低，然后打印出来。我计算了余弦相似度，但没有给出多少关于矩阵相似性的信息。让我们说A=“肺癌是一种恶性肿瘤”而B=“肺癌是一种肺部疾病”，由于疾病和肿瘤在语义上是相似的，所以A中相似度小的单词是“恶性”的，因为它与B中的

浏览 3提问于2022-02-20得票数 1

1回答

相似性评分在gensim中意味着什么？

python、text、gensim、sentence-similarity

我使用Gensim库来查找句子与段落集合、文本数据集之间的相似之处。分别使用了余弦相似度、软余弦相似度和移动测度。Gensim返回一个项目列表，包括、docid、和相似性评分。对于余弦相似度和软余弦相似度，我猜相似度是向量之间的余弦。我说的对吗？在Gensim文档中，他们写道，这是语义的关联性，没有额外的解释。我已经搜索了很多，但没有找到任何答案。有什么帮助吗？

浏览 0提问于2021-09-20得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

计算句子集合之间的语义相似度

如何预测给定句子的语法是否正确？

句子转换器如何预测新实例

如何根据常用词对文本进行分类

寻找文本中句子之间的语义连贯性

如何抓取语义相似的句子

STS基准数据集中的语义相似度得分是如何计算的？

对问答系统NLP的几点建议

使用tensorflow对句子相似性进行建模

欧几里德距离是否衡量语义相似性？

句子间的语义相似度

如何找到两个文档之间的相似度

是否可以使用Google BERT来计算两个文本文档之间的相似度？

用词向量表示句子的余弦相似度现在可以衡量词序吗？

一组文本文档的相似性

哪种类型的自动编码器可以实现文本相似性？

基于语义相似性的句子分类

句子语义相似度和频度

用相似算法python识别两个句子之间的缺失词

相似性评分在gensim中意味着什么？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐